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“提高 ”三 大 部 分 ， 共 7 章 ， 内 容 包 括 数 字 图 像 基 础 、 数 字 图 像 变 换 、 数 字 
图 像 分 析 、 图 像 特征 提取 、 图 像 识 别 搁 术 、 实 战 案 例 详解 和 思维 技法 点 
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材 ， 还 可 作为 本 科 毕 业 设计 、 研 究 生 学 术 论 文 的 参考 资料 。 
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天 、 星 球 探 测 、 和 车 事 侦察 、 公 安防 又 、 人 机 交互 和 文化 艺术 每 领域 受到 了 广泛 重视 并 取得 了 
众多 成 束 。 因 此 ， 越 来 越 多 的 科研 人 员 、 蜗 校 学 生 投 映 于 数字 图 像 的 学 习 、 研 究 当 中 。 

采用 MATLAB 软件 进行 数 季 图 像 处 理 ， 具 有 蜗 效 、 可 视 化 效果 好 的 特点 。 特 别 是 2012 
年 以 来 ，MATLAB 软件 针对 数字 图 像 处 理 技术 推出 了 诸多 新 功能 ， 包 括 在 图 像 处 理工 具 箱 
的 基础 上 又 推出 了 机 器 视觉 工具 箱 〈Computer Vision System), C 代码 转换 工具 等 。 

1. 本 书 的 特色 

(D 系统 全 面 ， 循 序 渐 进 

全 书 以 “需求 分 析 一 理论 推导 一 编程 实现 一 应 用 实例 一 优化 总 结 一 前 治 展 望 ”为 主线 ， 
全 面 系统 地 讲解 了 现代 数字 图 像 处 理 的 相关 内 容 ， 根 据 循序 渐进 的 原则 和 读者 认 知 心理 的 特 
点 ， 将 内 容 层 层 递 进 ， 使 所 论述 的 内 容 更 容易 被 吸收 ， 真 正 实 现 MATLAB 数字 图 像 处 理 技 
ABS Aq]. Wes. fH. MAD". 

(2) 内 容 新 帘 ， 突 出 前 沿 

本 书 在 介绍 图 像 变 换 、 图 像 分 析 、 特 征 提取 的 基础 上 ， 讲 述 了 MATLAB 在 数字 图 像 处 
理 方面 的 最 新 功能 ， 如 MATLAB 2012 Computer Vision System 基于 系统 对 象 的 编程 、 基 于 系 
统 模 型 的 实现 以 及 如 何 快速 通过 M 语言 生成 C 语言 。 同 时 ， 本 书 还 详细 介绍 了 现代 数字 图 
像 处 理 的 最 新 进展 ， 对 SIFT、SURF、 仿 生 处 理 方法 等 新 算法 的 基本 原理 、 实 现 过 程 、 核 心 



































人 研究 动 问 。 

(3) 案例 丰富 ， 解 释 甚 实 

本 书 根据 编者 近 些 年 来 从 事 数 子 图 像 处 理 教学 、 科 研 的 经 验 ， 列 蕉 了 近 100 个 关于 数字 
图 像 处 理 的 MATLAB 源 代码 实例 ， 并 附 有 详细 注解 。 通 过 对 源 代码 的 解析 ， 不 但 可 以 加 深 
读者 对 相关 理论 的 理解 ， 而 且 可 以 有 效 地 提高 读者 在 数字 图 像 处 理 方面 的 编程 能 力 。 本 书 所 
提供 程序 的 编程 思想 、 经 验 技巧 也 可 为 读者 采用 其 他 计算 机 语言 进行 数字 图 像 处 理 编程 提供 
EET 

2. 本 书 的 结构 安排 

本 书 的 结构 安排 如 图 1 所 示 ， 从 逻辑 上 分 为 “基础 “应 用 ”“ 提 高 ”三 大 部 分 ， 共 7 
草 ， 内 容 包括 数字 图 像 基 础 、 数 字 图 像 变 换 、 数 字 图 像 分 析 、 图 像 特 征 提取 、 图 像 识 别 拉 
术 、 实 战 案 例 详 解 和 思维 扩 法 点 拨 。 

3. 读者 对 象 

本 书 适 用 于 对 数字 图 像 技 术 感 兴趣 、 打 算 系 统 学 习 的 读者 ， 也 可 作为 电子 信息 工程 、 计 
算 机 科学 与 技术 相关 专业 的 本 科 生 、 研 究 生 的 教材 ;还 可 作为 本 科 毕 业 设 计 、 研 究 生 学 术 论 
文 的 参考 资料 。 
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第 1 章 数字 图 像 基础 2 


本 章 导 读 

亲爱 的 朋友 们 ， 从 现在 开始 ， 我 们 束 将 一 起 进入 数字 图 像 处 理 的 世界 了 ， 这 是 一 个 充满 
挑战 的 过 程 。“ 民 好 的 开端 是 成 功 的 一 半 ”， 为 了 使 大 家 能 够 尽快 对 数字 图 像 的 相关 理论 和 知 
识 有 一 个 清晰 的 理解 和 把 握 ， 本 革 问 大 家 介绍 一 些 关 于 数 子 图 像 处 理 的 常用 基本 知识 。 

本 章 分 别 从 基本 概念 、 开 发 应 用 、MATLAB 基础 三 个 大 的 方面 对 数字 图 像 处 理 的 基础 
知识 进行 评 细 的 讲解 ， 如 图 1-1 所 示 。 这 三 大 方面 从 内 容 结 构 上 讲 属于 并 行 天 系 ， 读 者 可 以 
根据 目 己 的 情况 有 选择 地 进行 阅读 。 


基本 概念 1.1 数字 图 像 处 理 概述 
像 开发 应 用 12 数字 图 像 处 理 的 开发 工具 


1.3 MATLAB 图 像 处 理 基 本 操作 


图 1-1 第 1 章 结构 安排 
1.1 数字 图 像 处 理 概 述 
DM 什 么 是 数字 图 像 


不 同 领 域 的 人 对 “图 像 ” 的 概念 有 看 不 同 的 理解 。 图 1-2 所 示 是 从 不 同 角 度 对 图 像 的 
定义 。 






































图 像 是 客 


图 像 是 客观 
观 世 界 能 量 
或 状态 以 可 
视 化 形式 在 
二 维 平面 上 
的 投影 


景物 (万 事 万 
物 ) 呈现 在 人 
心目 中 的 影像 


印象 或 反映 





图 1-2 ”从 不 同 角 度 对 图 像 的 定义 
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图 像 的 种 类 有 很 多 ， 根 据 人 眼 的 视觉 特性 可 将 图 像 分 为 可 见 图 像 和 不 可 见 图 像 。 可 见 图 
像 包 括 单 张 图 像 、 绘 图 、 图 像 序 列 等 ， 不 可 见 图 像 包 括 不 可 见 光 成 像 和 不 可 见 量 形成 的 图 ， 
如 电厂 波谱 图 、 温 度 计 压 力 等 的 分 布 图 。 图 像 按 像 素 空 间 坐标 和 胸 度 《或 色彩 ) 的 连续 性 可 
以 分 为 模拟 图 像 和 数 子 图 像 。 

那么 ， 什 么 是 数字 图 像 呢 ? 数 子 图像 是 相对 于 模拟 图 像 而 襄 的 。 简 言 之， 模拟 图 像 束 是 
物理 图 像 ， 人 有 眼 能 够 看 到 的 图 像 ， 它 是 连续 的 。 由 于 计算 机 无 法 直接 处 理 模 拟 图 像 ， 数 字 图 
像 应 运 而 生 。 数 字 图 像 是 模拟 图 像 经 过 采样 和 量化 使 其 在 空间 上 和 数值 上 都 离散 化 ， 而 形成 
的 一 个 数字 扣 阵 。 

数字 图 像 与 模拟 图 像 相 比 ， 有 以 下 几 个 方面 的 特点 。 

D 有 灵活 性 方面 。 对 模拟 图 像 的 处 理 ， 上 只 能 进行 简单 的 放大 、 绾 小 等 ， 而 数字 图 像 的 处 
理 方式 非常 精确 、 有 灵活 ， 可 以 进行 变形 、 改 变 腕 度 、 色 度 、 添 加 泪 镜 等 效 末 。 

2) 传输 性 方面 。 模 拟 图 像 以 实物 为 形体 ， 传 输 相 对 困难 ; 而 数字 图 像 以 数字 信息 为 载 
体 ， 传 输 相 对 较 快 。 

3) 再 现 性 方面 。 模 拟 图 像 不 易 保 存 ， 时 间 长 了 会 有 所 变化 ;而 数字 图 像 不 会 因为 你 
存 、 传 输 或 复制 而 产生 图 像 质 量 上 的 变化 。 
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先 必 须 对 其 在 空间 和 腕 度 上 进行 数字 化 ， 这 就 是 图 像 的 采样 和 量化 的 过 程 。 空 间 坐标 Guy) 








的 数字 化 称 为 图 像 采 样 ， 而 幅 值 数 字 化 称 为 灰 度 级 量化 ， 其 量化 过 程 如 图 1-3 所 示 。 
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景物 或 模拟 图 像 


图 1-3 物理 图 像 数 字 化 的 过 程 


(1) BRKE 

图 像 采 样 是 对 图 像 空 间 坐 标的 离散 化 ， 它 决定 了 图 像 的 空间 分 辩 紊 。 采 样 可 以 这 样 形象 
地 理解 : 用 一 个 方 格 把 竺 处 理 的 图 像 柳 兰 ， 然 后 把 每 一 小 格 上 模拟 图 像 澡 度 的 平均 值 作为 该 
小 方 格 中 点 的 值 ， 如 图 1-4 所 示 。 
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图 1-4 图 像 采 样 过 程 示意 图 
对 一 幅 图 像 采 样 时 ， 大 每 行 〈 横 问 ) 采样 数 为 M， 每 列 《〈 纵 问 ) 采样 数 为 N， 则 图 像 大 
小 为 M xN DRR, fx y) ERA (x,y) 处 的 灰 度 值 ， 则 Fx, y) 构成 一 个 MxN KAE 
HE, nx (1-1) 所 示 。 图 1-5 所 示 的 是 像素 不 同 的 图 像 比较 。 











F(x,y)— 


f(M-10) f(M-LI) … f(M-LN-1) 








图 1-5 像素 不 同 的 图 像 比较 
a) 像素 为 320x240 WE b) 像素 为 80x60 的 图 像 





像素 的 大 小 与 图 像 的 分 辨 紊 有 关 ， 分 辨 率 越 高 ， 像 素 就 越 小 ， 图 像 就 越 清晰 。 

(2) 灰 度 量化 

把 采样 后 所 得 的 各 像素 灰 度 值 从 模拟 量 到 离散 量 的 转换 称 为 图 像 灰 度 的 量化 。 量 化 是 对 
图 像 幅 度 坐 标的 离散 化 ， 它 决定 了 图 像 的 幅度 分 辩 率 。 

量化 的 方法 包括 分 层 量化 、 均 匀 量 化 和 非 均 匀 量 化 。 分 层 量化 是 把 每 一 个 离散 样本 的 连 
续 灰 度 值 分 成 有 限 多 的 层次 ， 均 匀 量 化 是 把 原 图 像 的 灰 度 层次 从 最 上 暗 至 最 亮 均匀 分 为 有 限 个 
层次 ， 如 果 采 用 不 均匀 分 层 就 称 为 非 均 匀 量 化 。 

当 图 像 的 采样 点 数 一 定 时 ， 采 用 不 同 量化 级 数 的 图 像 质量 不 一 样 。 量 化 级 数 越 多 ， 图 像 
质量 越 好 ， 量 化 级 数 越 少 ， 图 像 质量 越 差 。 量 化 级 数 小 的 极端 情况 就 是 二 值 图 像 。 
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下 面 介绍 几 种 常见 的 数字 图 像 类 型 。 
> 黑白 图 像 〈 见 图 1-6): 图 像 的 每 个 像素 只 能 是 黑 或 白 ,没有 中 间 的 过 渡 ， 故 又 称 为 
二 值 图 像 。 二 值 图 像 的 像素 值 为 0、1。 
1 0 0 
0 0 1 
1 1 


E. 


图 1-6 黑白 图 像 及 其 表示 


> KERZ OLE 1-7): 灰 度 图 像 是 指 每 个 像 聚 的 信息 由 一 个 量化 的 灰 度 级 来 描述 的 
图 像 ， 没 有 彩色 信息 。 


Ej- 


图 1-7 KREKAR EKRIR 


> 彩色 图 像 〈 见 图 1-8): 彩色 图 像 是 指 每 个 像素 的 信息 由 RGB 三 原色 构成 的 图 像 ， 其 
中 RBG 是 由 不 同 的 灰 度 级 来 摘 述 的 。 
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图 1-8 彩色 图 像 及 其 表示 


> 序列 图 像 : 把 具有 一 定 联 系 的 、 上 其 有 了 时间 先后 关系 的 图 像 称 为 序列 图 像 。 电 视 剧 或 
电影 图 像 主 要 是 由 序列 图 像 构成 的 。 


1.1.3 玖 子 图 像 处 理 技术 及 其 发 展 


数字 图像 处 理 (Digital Image Processing) 是 通过 计算 机 对 图 像 进行 去 除 噪声 、 增 强 、 复 
原 、 分 割 、 提 取 特 征 等 处 理 的 方法 和 技术 。 

数字 图 像 处 理 最 早出 现 于 20 世纪 50 年 代 ， 当 时 的 电子 计算 机 技术 已 经 发 展 到 一 定 水 
平 ， 人 们 开始 利用 计算 机 来 处 理 图 形 和 图 像 信息 。 数 子 图 像 处 理 作为 一 门 学 科大 约 形成 于 
20 世纪 60 年 代 初 期 。 早 期 的 图 像 处 理 的 目的 是 改善 图 像 的 质量 ， 它 以 人 为 对 象 ， 以 改善 
人 的 视觉 效果 为 目的 。 图 像 处 理 中 ， 输 入 的 是 质量 低 的 图 像 ， 输 出 的 是 改善 质量 后 的 图 
像 ， 和 常用 的 图 像 处 理 方法 有 图 像 增 强 、 复 原 、 编 码 、 压 缩 等 。 首 次 获得 实际 成 功 应 用 的 是 
天 国 喷气 推进 实验 室 〈JPL)。JPL 对 航天 探测 需 徘 徊 者 7 号 在 1964 SEAZIBIBJU T SK H ERR 
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片 使 用 了 图 像 处 理 技术 ， 如 几何 校正 、 灰 度 变 换 、 去 除 噪声 等 方法 ， 并 考虑 了 太阳 位 置 和 
月 球 环境 的 影响 ， 由 计算 机 成 功 地 绘制 出 月 球 表面 地 图 ， 获 得 了 巨大 的 成 功 。 随 后 又 对 探 
测 飞船 发 回 的 近 10 万 张 照片 进行 更 为 复杂 的 图 像 处 理 ， 最 终 获得 了 月 球 的 地 形 图 、 彩 色 图 
及 全 景 镶嵌 图 ， 取 得 了 非凡 的 成 果 ， 为 人 类 登 月 创举 奠定 了 坚实 的 基础 ， 也 推动 了 数字 O) 
图 像 处 理 这 门 学 科 的 诞生 。 此 后 ， 世 界 上 很 多 机 构 也 加 强 了 对 数字 图 像 处 理 技术 的 研 
究 ， 如 改进 设备 ， 成 立 专业 图 像 实验 室 等 。 同 时 其 应 用 范围 也 从 空间 研究 扩展 到 更 为 广 
ia rt 

近 20 年 来 ， 各 相关 学 科 领 域 的 发 展 对 图 像 处 理 提出 了 越 来 越 高 的 要 求 。 因 此 ， 对 数 
字 图 像 处 理 技术 的 研究 也 越 来 越 深 入 、 广 泛 ， 其 发 展 也 更 迅速 。 在 遥感 方面 ， 数 字 图 像 处 
理 技术 主要 应 用 在 航空 和 卫星 于 感 方面 。 可 以 说 ， 数 字 图 像 处 理 技术 推动 了 遥感 技术 的 进 
步 ， 发 展 了 多 光谱 图 像 遥 感 、SAR 图 像 遥 感 和 微波 图 像 过 感 ， 以 及 与 这 些 听 感 技术 相应 的 
处 理 技术 。 目 前 ， 人 们 运用 数字 图 像 处 理 技术 处 理 分 析 琐 感 图 像 ， 可 以 有 效 地 进行 资源 和 
矿藏 的 勘探 和 调查 、 农 业 和 城市 的 土地 规划 、 作 物 估 产 、 气 象 预 报 、 灾 害 及 军事 目标 的 监 
视 等 ， 在 生物 医学 工程 方面 ， 图 像 处 理 的 应 用 开展 较 早 。 医 学 图 像 主要 有 X 射线 图 像 、 超 
声 图 像 和 生物 切片 显 微 图 像 。 运 用 图 像 处 理 技术 可 以 提高 图 像 的 清晰 度 和 分 辨 率 ， 便 于 医 
生 诊断 ， 在 工业 和 工程 方面 ， 图 像 处 理 技术 已 有 效应 用 于 无 损 探伤 、 质 量 检测 和 过 程 自动 
控制 等 方面 ， 如 应 力 分 析 、 流 场 分 析 、 机 械 零 件 检测 和 识别 、 印 制 电 路 板 症 病 检查 等 ;在 
军事 方面 ， 飞 行 导 航 、 导 弹 打 针 的 景物 图 像 制导 是 对 图 像 处 理 技术 需求 最 迫切 ， 也 是 最 能 
体现 其 价值 的 应 用 领域 。 此 技术 是 通过 判读 侦察 照片 ， 进 行 图 像 匹配 识别 和 跟踪 。 此 外 ， 
















































































包括 网 像 传 输 、 存 储 和 显示 的 目 动 化 指挥 系统 ， 改 机 、 坦 元 和 和 苗 舰 模拟 训练 器 ， 也 都 用 到 
图 像 处 理 技术 。 


UNE 效 字 图 像 的 矩阵 表示 








二 维 图 像 进 行 均匀 采样 并 进行 灰 度 量化 后 ， 束 可 以 得 到 一 幅 离 歼 化 成 M x IN. 样本 的 数字 
图 像 。 访 数字 图 像 是 一 个 整数 阵列 ， 因 而 可 用 和 窍 阵 来 且 观 地 摘 述 该 数字 图像。 如 末 采 用 如 
图 1-9 所 示 的 采样 网 络 来 对 图 像 进行 采样 量化 ， 则 可 得 到 如 式 (1-1)》 的 数学 化 图 像 表 示 。 
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图 1-9 图 像 采 样 网 格 示 意图 
这 样 ， 一 幅 数 学 图 像 在 MATLAB 中 可 以 很 自然 地 表示 为 形 如 式 (1-2)〉 的 矩阵 。 
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f= : : (172) 


注意 : 由 于 在 MATLAB TÓERER4]4 —/47G E M FARZ (1,1 )， 因 此 在 式 (1-2) 中 
f 0,1) SEA (1-1) 中 的 /(06,0). A (1-1) 和 式 (1-2) 在 表示 上 意思 是 一 样 的 ， 只 是 原 
点 不 同 。 


因此 ， 对 数字 图像 进行 处 理 ， 也 就 是 对 特定 的 矩阵 进行 处 理 。 在 C 语言 中 ， 对 MxN 数 
学 图 像 处 理 的 核心 代码 如 下 。 
for G=0;j<N;j++) 
for(1=0;1<M;1++) 
{ 对 I(ij) 的 具体 运算 
J; 
在 MATLAB 中 ， 对 MxN 数字 图 像 处 理 的 核心 代码 如 下 。 
for 1=1:N 
for j=1:M 
对 I(ij) 的 其 体 运算 
end 


end 
ey 


pide tg: 重要 概念 理解 点 睛 | 
六 “像素 ”的 英文 为 “pixel”， 它 是 “picture” 和 “element” 的 合成 词 ， 表 示 图 像 元 t i 
素 的 意思 。 可 以 对 “像素 ”进行 如 下 理解 : 像素 是 一 个 面积 概念 ， 是 构成 数字 图 像 S 
的 最 小 单位 。 
六 “ 灰 度 ”可 以 认为 是 图 像 色彩 元 度 的 深浅 。 图 像 所 能 够 展现 的 灰 度 级 越 多 ， 也 就 意 j 
味 着 图 像 可 以 表现 更 强 的 色彩 层次 。 如 果 把 黑 一 灰 一 白 连续 变化 的 灰 度 值 量化 为 1 
256 个 灰 度 级 ， 灰 度 值 的 范围 为 0~255， 表 示 亮 度 从 深 到 浅 ， Aa u 
从 黑 到 和 白 。 
> 数字 图 像 处 理 就 是 将 图 像 转 换 成 一 个 数据 矩阵 存放 在 存储 器 中 ， 然 后 再 利用 计算 
机 或 其 他 的 大 规模 集成 数字 器 件 对 数据 抵 阵 信息 进行 数字 处 理 ， 以 达到 所 预期 的 
效 采 。 } 


1.2 ”数字 图 像 处 理 的 开发 工具 


(1) 什么 是 MATLAB 

MATLAB 是 矩阵 实验 室 (Matrix Laboratory) WPK, R E] MathWorks 公司 出 品 的 商 
业 数 学 软件 ， 广 泛 应 用 于 算法 开 友 、 数 据 可 视 化 、 数 据 分 析 以 及 数值 计算 的 高 级 技术 计算 语 
言 和 交互 式 环境 ， 主 要 包括 MATLAB 和 Simulink 两 大 部 分 。MATLAB 的 启动 界面 如 图 1-10 
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所 示 。 
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图 1-10 MATLAB 软件 启动 界面 


MATLAB 将 数值 分 析 、 和 矩阵 计算 、 科 学 数据 可 视 化 以 及 非 线 性 动态 系统 的 建 模 和 仿真 
等 诸多 强大 功能 集成 在 一 个 易于 使 用 的 视窗 环境 中 ， 为 科学 研究 、 工 程 设计 以 及 需要 进行 有 
效 数 值 计 算 的 众多 科学 领域 提供 了 一 种 全 面 的 解决 方案 ， 并 在 很 大 程度 上 摆脱 了 传统 非 交 互 
式 程序 设计 语言 CW C, FORTRAN) 的 编辑 模式 。 

MATLAB 可 以 进行 矩阵 运算 、 绘 制 函 数 和 数据 、 实 现 算法 、 创 建 用 户 界 面 、 连 接 其 他 
编程 语言 的 程序 等 ， 广 泛 应 用 于 以 下 领域 。 

> 数值 分 析 。 

> 数值 和 符号 计算 。 

> 工程 与 科学 绘图 。 

> 控制 系统 的 设计 与 仿真 。 

> 数字 图 像 处 理 技术 。 

> 数字 信号 处 理 技术 。 

> 通信 系统 设计 与 仿真 。 

> 财务 与 金融 工程 。 

在 数字 图 像 处 理 方面 ，MATLAB 提供 了 数据 采集 、 数 据 库 接口 、 概 率 统计 、 样 条 拟 
合 、 优 化 算法 、 偏 微分 方程 求解 、 神 经 网 络 、 小 波 分 析 、 信 号 处 理 、 图 像 处 理 、 模 型 预测 、 
模糊 逻 辑 、 风 入 式 系 统 开发 、 定 点 仿真 、 与 DSP 通信 等 非常 多 的 工具 箱 ， 已 经 能 满足 几乎 
所 有 图 像 处 理 算法 的 开发 需要 。 

(2) 用 MATLAB 处 理 数字 图 像 的 特点 


























^ MATLAB 数字 图 像 处 理 实战 





MATLAB 程序 编写 形式 较为 自由 ， 可 以 利用 丰 宦 的 库 函 数 避 开 繁 杂 的 子 程 厅 编 程 任 
务 ， 上 压缩 了 一 切 不 必要 的 编程 工作 。 库 函数 都 由 本 领域 的 专家 编写 。 可 以 说 ， 用 MATLAB 
进行 科技 开发 是 站 在 专家 的 屑 膀 上 。 

> XS 

由 于 MATLAB 是 用 C 语言 编写 的 ， 所 以 它 提供 了 和 C 语言 儿 乎 一 样 多 的 运算 符 ， 有 灵活 
使 用 MATLAB 的 运算 符 将 使 程序 变 得 极为 简短 。 

> 编程 灵活 

MATLAB 既 具 有 绪 构 化 的 控制 语句 〈 如 for JAA, while 循环 、break 语句 和 if 语句 )， 
又 有 面 问 对 象 编程 的 特性 。 

> 程序 设计 目 由 度 大 

程序 限制 不 严格 ， 如 在 MATLAB 里 ， 用 户 无 需 对 算 阵 预定 义 束 可 使 用 。 

> 程序 可 移植 性 好 

在 MATLAB 环境 下 编写 的 程序 ， 基 本 上 不 做 修改 束 可 以 在 各 种 型 号 的 计算 机 和 操作 系 
统 上 运行 。 

> MATLAB 的 图 形 功能 强大 

在 FORTRAN 和 C 语言 里 ， 绘 图 都 很 不 容易 ， 但 在 MATLAB 里 ， 数 据 的 可 视 化 非常 简 
单 。MATLAB 还 具有 很 强 的 编辑 图 形 界 面 的 能 

> 有 功能 强大 的 工具 箱 

MATLAB 包含 两 个 部 分 : 核心 部 分 和 各 种 可 选 的 工具 箱 。 核 心 部 分 有 数 百 个 核心 内 部 
函数 。 工 具 箱 义 分 为 两 类 : 功能 性 工具 箱 和 学 科 性 工具 箱 。 功 能 性 工具 箱 主 要 用 来 扩充 其 符 
写 计 算 功 能 、 岁 示 建 模仿 真 功 能 、 文 字 处 理 功 能 以 及 与 使 件 实时 交互 功能 ， 可 用 于 多 种 学 
Fh 而 学 科 性 工具 箱 是 专业 性 比较 强 的 ， 如 Image Processing. Video and Image Processing 
Blockset， 这 些 工具 箱 都 是 由 该 领域 内 学 术 水 平 很 蜗 的 专家 编写 的 ， 所 以 用 望 无需 编写 日 己 
学 科 范 围 内 的 基础 程序 ， 束 可 以 直接 进行 高 、 精 、 人 尖 的 研究 。 

> 源 程序 的 开放 性 

开放 性 也 许 是 MATLAB 最 受 人 们 欢迎 的 特点 。 除 内 部 函数 以 外 ， 所 有 MATLAB 的 核 
心 文件 和 工具 箱 文件 都 是 可 读 可 改 的 源 文件 ， 用 户 可 通过 对 源 文件 的 修改 以 及 加 入 目 己 的 文 
件 构 成 新 的 工具 箱 。 

但 是 ，MATLAB 也 存在 如 下 不 足 : 与 其 他 语言 高 级 程序 相 比 ，MATLAB 程序 的 执行 速 
度 较 慢 。 这 是 因为 MATLAB 的 程序 不 用 编译 等 预 处 理 ， 也 不 生成 可 执行 文件 ， 程 序 为 解释 
执行 ， 所 以 速度 较 慢 。 


(M OpenCV 机 器 视觉 库 


(1) 什么 是 OpenCV 

OpenCV 的 全 称 是 Open Source Computer Vision Library， 是 由 Intel 公司 资助 的 开源 计算 
机 视觉 库 。 它 由 一 系列 C 函数 和 少量 的 C++ 类 构成 ， 实 现 了 图 像 处 理 和 计算 机 视觉 方面 的 
很 多 通用 算法 。 独 立 于 操作 系统 、 使 件 和 网 形 管理 页 ，OpenCY 拥有 包括 300 多 个 C/C++ FR 
数 的 路 平台 的 中 、 高 层 API 编程 接口 ， 使 用 通用 的 图 像 、 视 频 载 入 、 你 存 和 获取 模块 。 它 不 
依赖 于 其 他 的 外 部 库 ， 同 时 也 可 以 使 用 某 些 外 部 库 。 








































































































数字 图 像 基 础 





OpenCV 对 非 商 业 应 用 和 商业 应 用 都 是 免费 的 ， 其 实例 如 图 1-11 AR. Ah, OpenCV 
也 为 Intel 公司 的 Integrated Performance Primitives (IPP) 提供 了 透明 接口 。 这 意味 着 ， 如 果 
有 为 特定 处 理 器 《当然 是 Intel 的 处 理 嚣 了) 优化 的 IPP E, OpenCV 将 在 运行 时 目 动 加 载 这 




















全 
EE MeanShift Tracker 
Bel 
i Play Stop Rewind |Bins: 30 
(X2126, Y 2150, Width 49, Height-72) Update Rate: 500 
1-11 运用 OpenCV 进行 图 像 处 理 的 实例 图 
OpenCV 提供 的 视 党 处 理 算 法 非 冲 丰富， 并 且 它 部 分 以 C 语言 编写 ， 加 上 其 开源 的 特 





性 ， 只 要 处 理 得 当 ， 不 需要 添加 新 的 外 部 文 持 也 可 以 完整 地 编译 链接 生成 执行 程序 ， 所 以 
很 多 人 用 它 来 做 算法 的 移植 ，OpenCV 的 代码 经 过 适当 改写 可 以 正常 地 运行 在 DSP 系统 和 
单片机 系统 中 ， 目 前 这 种 移植 在 大 学 中 经 党 作为 相关 专业 本 科 生 毕业 设计 或 者 研究 生 的 人 研 
究 课 题 。 

用 OpenCV 处 理 数字 图 像 具 有 如 下 的 特点 。 

> 开源 图 像 处 理 算 法 库 。 

> 跨 平 台 的 中 高 层 API (Windows/Linux). 

> 免费 共享 〈 商 业 / 非 商业 )。 

> 速度 快 ， 使 用 方便 。 

> 可 扩展 性 好 ， 包 括 底 层 和 高 层 的 开发 包 。 

(2) 为 什么 会 有 OpenCV 
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计算 机 视 党 市 场 巨 大 而 且 持续 增长 ， 且 这 方面 没有 标准 API, Æ OpenCV 出 现 之 前 的 计 
算 机 视 党 软件 有 下 面 几 点 不 足 。 

> 代 人 码 执 行 慢 、 不 稳定 ， 独 立 并 与 其 他 库 不 羔 容 。 

> 商业 化 工具 〈 比 如 Halcon, MATLAB+Simulink) 耗费 很 高 。 

因此 ， 据 切 需要 一 个 标准 的 API 来 简化 计算 机 视觉 程序 和 解决 方案 的 开发 。OpenCYV W 
是 顺应 这 样 的 要 求 而 出 现 的 标准 API RUE 

(3) OpenCV 的 组 成 

OpenCV 主要 由 Cv、HighGUI、CxCore、CvAux、CvCam 和 ml 这 几 部 分 组 成 ， 如 
图 1-12 所 示 。 








基本 结构 和 算法 函数 
机 器 学 习 (分 类 器 ) o Cy 用 户 交 互 部 分 


图 像 处 理 及 计算 机 视觉 功能 


s 


OpenCV 附加 库 函 数 
图 1-12 OpenCV 的 组 成 


> Cv: 包含 一 些 基 本 结构 和 算法 函数 ， 如 数据 结构 与 线性 代数 文 持 ， 主 要 提供 各 种 数 
据 类 型 的 基本 运算 功能 。 

> HighGUI: 用 户 交 互 部 分 (GUI、 图 像 视 频 IO， 系 统 调用 函数 等 )。 

> CxCore: 图 像 处 理 和 计算 机 视觉 功能 ， 是 主要 的 OpenCV 函数 ， 包 括 图 像 处 理 、 结 
构 分 析 、 运 动 分 析 、 物 体 跟踪、 模式 识别 以 及 摄像 机 标定 等 功能 。 

> CvAux: OpenCV 附加 库 函 数 ， 包 含 一 些 实验 性 的 函数 ， 如 视角 校正 、 三 维 跟 踩 、 
PCA, HMM 等 函数 。 

> CvCam: 在 Linux 版 本 中 已 经 抛弃 ， 而 且 在 Windows 中 将 DirectX 支持 引入 
HighGUI 后 ，CvCam 将 被 彻底 抛弃 。 

> ml: 机 器 学 习 模 块 ， 主 要 内 容 为 分 类 器 。 

(4) OpenCV 的 功能 。 

作为 一 个 独立 的 图 像 处 理 库 ，OpenCYV 可 以 实现 以 下 功能 。 

> 图 像 数 据 的 操作 : 分 配 、 和 释放、 复制 、 设 置 和 转换 。 

> 图 像 /视频 的 输入 输出 (VO): 文件 与 摄像 头 的 输入 、 图 像 和 视频 文件 输出 。 

> 矩阵 和 问 量 的 操作 以 及 线性 代数 的 算法 程序 窍 阵 积 、 解 方程 、 特 征 值 以 及 奇异 
值 等 。 

> 各 种 动态 数据 结构 : 列表、 队列 、 集 合 、 树 和 图 等 。 

> 基本 的 数字 图 像 处 理 : 滤波 、 边 缘 检 测 、 角 点 检测 、 采 样 与 差 值 、 色 彩 转 换 、 形 态 
操作 、 直 方 图 和 图 像 金字 塔 等 。 
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> 结构 分 析 : 连接 部 件 、 轮 廓 处理、 距离 变换 、 各 自 距 计算 、 模 板 匹 配 、Hough AE 
ja. ZAPE BRAWE Wd Delaunay 三 角 划 分 等 。 
> HELER: 发 现 与 跟 踩 定 标 模式 、 定 标 、 基 本 矩阵 估计 、 章 次 矩阵 估计 和 立体 
对 应 。 

> 运动 分 析 : 光 流 、 运 动 分 制 和 跟踪 。 

> 目标 识别 : 特征 法 、 隐 马尔 可 夫 模 型 。 

> 基本 的 GUI: 图 像 与 视频 显示 、 键 盘 与 鼠标 事件 处 理 和 滚动 条 。 

> 图 像 标 注 : 线 、 二 次 曲线 、 多 边 形 和 男 文 字 。 

(5) OpenCV 的 应 用 领域 

因 具 有 开源 、 独 立 、 免 费 等 特性 ，OpenCV 的 应 用 可 以 跨越 不 同 的 硬件 平台 和 软件 平 
台 ， 因 此 所 有 使 用 机 器 视觉 的 地 方 都 可 以 使 用 OpenCV 来 对 图 像 进行 处 理 。 其 主要 应 用 领域 
包括 人 机 互动 、 物 体 识别 、 图 像 分 割 、 人 脸 识 别 、 动 作 识 别 、 运 动 跟踪 和 机 器 人 等 。 

(6) OpenCV 5 MATLAB 图 像 处 理工 具 箱 的 比较 

OpenCV 和 MATLAB 疼 像 处 理工 具 箱 两 者 都 有 目 己 的 特点 ， 在 不 同 应 用 中 有 看 重要 地 
位 ， 如 表 1-1 所 示 。MATLAB 图 像 处 理工 具 箱 编程 直观 方便 ， 适 合 进 行 算 法 的 测试 和 仿 
真 ， 可 以 快速 得 到 理论 推导 的 结果 ， 但 也 正 因为 如 此 ， 许 多 处 理 算法 未 经 很 好 的 优化 ， 处 理 
速度 比 不 上 OpenCV。 此 外 ，MATLAB 图 像 处 理工 具 箱 中 部 分 代码 不 开源 ， 应 用 平台 较为 局 
限 ， 不 是 非常 适用 于 商业 软件 的 开发 ，OpenCV 作为 专门 的 图 像 处 理 库 ， 算 法 经 过 很 好 的 优 
化 ， 效 率 高 ， 开 源 免费 ， 而 且 可 以 路 平台 使 用 ， 适 用 于 各 种 实时 图 像 处 理 系 统 的 开发 ， 但 对 
于 不 熟悉 C/C++ 编程 语言 的 用 户 来 说 ，OpenCYV 5 MATLAB 相 比 ， 编 程 并 不 十 分 直观 ， 编 
程 调 试 需要 花费 较 多 时 间 。 















































表 1-1 OpenCV 5 MATLAB 图 像 处 理工 具 箱 的 比较 





OpenCV MATLAB 图 像 处 理工 具 箱 
编程 语言 ， 效 率 高 脚本 语言 ， 直 观 方便 
适合 开发 实时 系统 适合 算法 测试 
图 像 处 理 算法 经 过 优化 ， 速 度 快 多 数 图 像 处 理 算法 较 OpenCV 在 同等 硬件 条 件 下 慢 
完全 开源 部 分 核心 代码 不 可 得 


PK VLIB 软件 库 


VLIB 软件 库 是 德州 仪器 (TI) 公司 推出 的 可 帮助 视频 或 视觉 系统 开发 人 员 显 车 加 速 产 
品 开发 的 。VLIB 集合 了 超过 40 种 软件 内 核 的 可 扩展 软件 库 ， 并 针对 TI 目 己 的 
TMS320C64x+ 内 核 DSP 进行 了 精心 优化 。 这 些 内 核 可 执行 背景 建 模 与 背景 抽取 算法 ， 目 标 
特性 提取 、 跟 踪 、 识 别 以 及 低 像 素 处 理 等 功能 ， 尽管 其 无 法 取代 经 验 丰 富 的 开发 团队 ， 但 
VLIB 却 能 大 幅 简 化 工作 并 显著 加 速 项 目 开 友 进 程 。 

用 VLIB 库 处 理 数字 图 像 具 有 如 下 的 特点 。 

(1) 高 效率 、 低 功 耗 

相对 于 标准 C 语言 代码 ， 采 用 VLIB 的 开发 人 员 可 将 像素 处 理性 能 提升 10 ALE, AMN 
文 持 更 高 分 辨 率 及 帧 频 处 理 功能 ， 而 且 还 拥有 更 多 高 级 特性 或 更 高 的 单位 右 件 通道 数 ， 同 时 也 
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意味 看 可 将 系统 功 耗 降低 90%. i5] VLB 软件 库 进行 图 像 处 理 的 实例 如 图 1-13 所 示 。 





VLIB C! VLIB enode bin 
Background square mo 
VLIB dilate bin 
VLIB ConvertUY T 互 连 组 件 
VLIB_CreaieCCList 
VLIB_CreaicCCMap8 


HRZ 


VLIB updateEWR 
MeanS16 
VLIB updateEWR 
VarianceS16 


实现 更 高 分 辩 率 与 帧 速率 
支持 更 多 高 级 特性 


允许 使 用 较 低 成 本 的 C64x+ DSP 


1-13. 38H VLIB 软件 库 进 行 图 像 处 理 的 实例 图 


(2) 高 兼容 性 和 可 移植 性 

此 外 ，VLIB 还 允许 使 用 较 低 成 本 的 C64x+DSP， 并 能 加 速 软件 从 PC 系统 向 C64x+DSP 
内 核 的 移植 ， 现 有 客户 利用 VLIB 可 在 4 周 内 将 C 语言 代码 升级 到 C64x+DSP 平台 。 

(30 FRIAR 

采用 VLIB 全 新 开发 可 将 优化 时 间 缩 短 到 1j]. VLIB 使 视频 监控 系统 、 汽 车 视觉 、 机 
器 视觉 以 及 消费 类 电子 产品 等 应 用 和 市 场 领域 受益 菲 浅 。 用 户 可 以 通过 申请 免费 下 载 
VLIB， 获 得 内 核 库 ， 包 括 超 过 40 种 内 核 、 用 户 指南 、 演 示 和 测试 脚本 。 

相 比 前 面 两 个 主流 的 图 像 处 理工 具 ，VLIB 是 新 生 的 一 个 图 像 处 理工 具 ， 各 方面 都 还 在 
完善 当中 。 这 个 网 像 处 理 库 不 是 定位 于 算法 开发 设计 ， 而 是 纯 商 业 应 用 ， 尽 管 在 以 往 的 测试 
比较 中 ，VLIB 以 其 突出 的 性 能 吸引 来 许多 目光 ， 但 其 优势 的 发 挥 更 多 的 时 候 需 要 配合 TI 公 


























司 目 己 的 图 像 处 理 专用 DSP 心太 来 完成 ， 因 而 更 适用 于 产品 开发 。 


1.3 MATLAB 图 像 处 理 操作 基础 
12: ECET SA 





图 像 处 理工 具 箱 是 MATLAB 环境 下 开发 出 来 的 许多 工具 箱 之 一 ， 它 是 以 数字 图 像 处 理 
理论 为 基础 ， 用 MATLAB 语言 构造 了 一 系列 用 于 图 像 数 据 显示 与 处 理 的 M 文件 ， 使 用 者 可 
以 得 看 这 些 M XTEIINIJEXETI UGIE. PERIERE T RAB nILSCREITI SER AB BERI a, 1L 
括 以 下 内 容 。 

1) 图 像 的 空域 变换 包括 了 第 见 的 网 像 操 作 ， 如 图 像 缩放 、 旋 转 、 裁 前、 勇 变 、 翻 转 、 
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平移 ， 二 维 及 多 维 图 像 的 仿 射 变换 、 投 影 变 搞 、 盒 形变 换 ， 此 外 还 可 以 更 改 参数 、 目 写 义 变 
RKA, 

2) 形态 学 运算 。 它 包括 如 下 内 容 。 

> 腐 亿 和 膨胀 ， 通 过 这 两 个 算法 可 以 把 二 值 图 像 的 纹理 进行 平滑 、 细 化 ， 也 可 以 用 来 O) 

消除 图 像 中 零散 的 不 连续 点 ， 从 而 达到 除 品 保留 纹理 的 目的 。 

> 形态 学 重 构 。 它 利用 模板 (mask) 的 信息 来 对 网 像 进行 处 理 。 通 过 形态 学 重建 很 容 

多 得 到 图 像 的 峰值 点 和 低谷 点 ， 而 不 受 局 部 大 小 变化 的 影 啊 。 
> 距离 变换 。 在 图 像 中 描述 点 与 点 之 间 的 距离 有 4 种 ， 即 Euclidean、CityBlock、 
Chessboard、Quasi-Euclidean。 工 具 箱 提供 了 bwdist 函数 来 计算 这 些 点 之 间 的 距离 。 
> 目标 、 区 域 、 特 征 测度 。 包 括 对 二 值 图 像 中 的 连通 区 域 标 写 ， 且 用 标号 矩阵 获得 图 
像 的 统计 信息 ; 选取 二 值 图 中 的 目标 ;计算 二 值 图 前 景 的 面积 ; 计算 二 值 图 的 
Euler 数 。 

> 检查 表 操 作 。 

3) 图 像 的 邻 域 运算 和 块 运算 。 

> 块 操作 是 指 对 网 像 局 部 块 操作 而 非 全 局 操作 ， 包 括 重 登 或 非 重 登 块 网 种 类 型 。 比 如 

对 图 像 进 行 平滑 时 常 采 用 重 车 块 ， 这 里 的 块 实际 是 一 个 背 动 窗口 ， 对 整 幅 图 像 按 照 
从 上 至 下 、 从 左 至 右 的 顺序 依次 进行 操作 ， 滑 动 的 步 长 一 般 是 一 个 像素 ; 反之， 不 
章 车 的 块 束 是 边界 搭 边界 的 处 理 窗口 ， 两 个 块 没有 公共 区 域 。 

> 列 操作 是 把 图 像 的 块 拉 伸 为 一 个 列 问 量 ， 这 样 处 理 的 优点 就 是 运行 速度 快 。 

4) 线性 滤波 和 滤波 上 右 设 计 。MATLAB 图 像 处 理工 具 箱 提供 了 众多 第 见 的 空域 滤波 模 
板 ， 包 括 平 滑 和 锐 化 ， 如 Laplacian 模板 、Sobel 模板 、Prewitt 模板 及 Roboerts 模板 等 。 此 
外 ， 也 可 以 在 频 域 进行 这 些 滤波。 工 其 箱 提 供 了 小 波 器 设计 函数 ， 可 以 日 定义 一 个 小 波 器 ， 
然后 在 频 域 中 进行 图 像 滤 波 。 

5) KZE. MATLAB 图 像 处 理工 具 箱 提供 的 图 像 变换 函数 包括 Fourier 变换 、 离 敌 
RIZE, Radon 变换 、Hough 变换 、Fan-Bean 投影 数据 变换 以 及 小 波 变 换 。 

6) 图 像 分 析 和 增强 。MATLAB 图 像 处 理工 具 箱 在 图 像 分 析 和 增强 方面 主要 提供 了 5 个 
方面 的 内 容 ， 即 获得 网 像 像 素 灰 度 信息 和 统计 信息 ; 边缘 检测 、 边 界 跟 踪 以 及 运用 二 叉 树 分 
解 等 方法 对 网 像 进行 分 析 ;， 图 像 的 纹理 分 析 ; 亮度 调节 ; ZI. 

7) 图 像 恢复 。MATLAB 图 像 处 理工 具 箱 提供 了 4 种 图 像 恢 复 的 方法 ， 即 维 纳 涛 小 、 
Lucy-Richardson 友人 代 非 线 性 复原 算法 、 约 束 最 小 二 乘 正则) EA BERRA. 

8) 感 兴趣 区 域 操作 。MATLAB 图 像 处 理工 具 箱 提供 了 对 图 像 感 兴趣 区 域 的 界定 、 滤 
波 ， 还 对 图 像 的 色彩 转换 提供 了 很 多 有 用 的 函数 。 

从 上 面 的 论述 可 以 看 出 ，MATLAB 图 像 处 理工 具 箱 几乎 包含 了 常见 的 所 有 图 像 处 理 函 
数 。 此 外 ， 对 于 图 像 的 基本 操作 ， 如 输入 、 输 出 、 保 存 等 都 得 到 了 完美 的 支持 。 当 然 ， 读 者 
也 可 以 目 己 编写 函数 来 扩展 其 功能 。MATLAB 中 的 信号 处 理工 具 箱 、 神 经 网 络 工 具 箱 、 模 



































































































































糊 旬 辑 工 具 箱 和 小 波 变 换 工 具 箱 也 可 用 于 协助 执行 图 像 处 理 任 务 。 


IEPA 效 字 图 像 处 理 的 基本 操作 





(1) 图 像 文 件 的 读 取 
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利用 imread 函数 可 以 完成 图 像 文件 的 读 取 操作 。 常 用 语法 格式 为 : 
I-imread(*filename',*fmt') EV I=imread(‘filename.fmt’); 


其 作用 是 将 文件 名 用 字符 串 filename 表示 的 、 扩 展 名 用 字符 串 fmt (表示 图 像 文件 格 
XO 表示 的 图 像 文件 中 的 数据 读 到 矩阵 了 中 。 当 filename 中 不 包含 任何 路 径 信 息 时 ，imread 
会 从 当前 工作 目录 中 寻找 并 读 取 文件 。 要 想 读 取 指 定 路 径 中 的 图 像 ， 最 简单 的 方法 就 是 在 
filename 中 输入 完整 的 或 相对 的 地 址 。MATLAB 支持 多 种 图 像 文件 格式 的 谈 、 写 和 显示 。 
例如 ， 命 令 行 


I-imread( lena.jpg"); 


将 JPEG 图 像 lena 谈 入 图 像 矩 阵 了 中 。 

2) 网 像 文件 的 号 入 《保存 ) 

利用 imwrite 函数 完成 图 像 的 输出 和 保存 操作 ， 也 完全 文 持 上 述 各 种 岁 像 文件 的 格式 。 
其 语法 格式 为 : 


imwrite(L filename", fmt") ek imwrite(L.filename.fmt'); 


其 中 的 大 filename 和 fmt 的 意义 同上 所 述 。 

当 利 用 imwrite 函数 保存 图 像 时 ，MATLAB 默认 的 保存 方式 是 将 其 从 化 为 uint8 的 数据 
类 型 。 

(3) 图 像 文 件 的 显示 

图 像 的 显示 过 程 是 将 数字 图像 从 一 组 离散 数据 还 原 为 一 幅 可 见 图 像 的 过 程 。 

MATLAB 的 图 像 处 理工 具 箱 提供 了 多 种 图 像 显 示 技 术 。 例 如 imshow PA UJ LL ECBZ A XC 
件 显示 多 种 图 像 ，image 函数 可 以 将 窍 阵 作为 图 像 ， colorbar FK Zi n] EJ Hoe S ZR ELE A 
montage 函数 可 以 动态 显示 图 像 序列 。 

10 图 像 的 显示 

imshow 了 国 数 是 最 利用 的 显示 各 种 图 像 的 函数 ， 其 调用 格式 如 下 。 


imshow(LN); 


imshow(CM) 用 于 显示 灰 度 图 像 ， 其 中 了 为 灰 度 图 像 的 数据 矩阵 ，N 为 灰 度 级 数目 ， 默 认 
值 为 256。 
例如 下 面 的 语句 用 于 显示 一 幅 灰 度 图 像 。 


I-imread( lena.jpg"): 
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imshow(lI); 
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显示 。 








imshow filename 


HEH, filename 为 要 显示 的 图 像 文件 的 文件 名 。 
例如 ， 显 示 一 幅 在 当前 目录 下 的 .bmp 格式 的 图 像 : 


imshow lena.bmp 
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结果 如 图 1-14 所 示 。 

需要 注意 的 是 ， 该 文件 名 必须 市 有 合法 的 扩展 名 (指明 文件 格式 )， 且 该 图 像 文 件 必 须 
保存 在 当前 目录 下 或 在 MATLAB 默认 的 目录 下 。 

2) 添加 色 带 > 

colorbar 图 数 可 以 给 一 个 坐标 轴 对 象 添 加 一 条 色 带 。 如 果 该 举 标 轴 对 象 包含 一 个 图 像 对 
象 ， 则 添加 的 色 带 将 指示 出 访 图 像 中 不 同 凑 色 的 数据 值 。 这 对 于 了 解 被 显示 图 像 的 灰 度 级 特 
IAH- 

例如 ， 


I-imread( “lena.jpg”); 

















imshow(lI); 
colorbar; 


由 图 1-15 可 知 ， 该 图 像 是 数据 类 型 为 uint8 的 灰 度 图 像 ， 其 灰 度 级 范围 为 0 一 255。 





| J "Figure No. 1 











1-14. 显示 一 幅 图 像 文件 中 的 图 像 图 1-15 显示 图 像 并 加 入 颜色 条 


3) 显示 多 幅 图 像 

显示 多 幅 图 像 最 简单 的 方法 就 是 在 不 同 的 图 形 窗口 中 显示 它们 。Imshow 函数 总 是 在 当 
前 窗口 中 显示 一 幅 图 像 ， 如 果 用 户 想 连续 显示 两 幅 图 像 ， 那 么 第 二 幅 图 像 束 会 蔡 代 第 一 幅 图 
像 。 为 了 避免 向 像 在 当前 窗口 中 的 履 盖 现象 ， 在 调用 imshow 疯 数 显示 下 一 幅 图 像 之 前 可 以 
使 用 figure 命令 来 创建 一 个 新 的 窗口 。 例 如 : 


imshow(Il1); 
figure, imshow(I2); 




















figure, imshow(13); 


有 时 为 了 便于 在 多 幅 图 像 之 间 进 行 比较 ， 需 要 将 这 些 图 像 显 示 在 一 个 图 形 窗口 中 。 达 到 
这 一 目的 有 两 种 方法 : 一 种 方法 是 联合 使 用 imshow 和 subplot 函数 ， 但 此 方法 在 一 个 图 形 窗 
口上 只 能 有 一 个 调 色 板 ; 另 一 种 方法 是 联合 使 用 subimage 和 subplot 函数 ， 此 方法 可 在 一 个 图 
窗口 内 使 用 多 个 调 色 板 。 
subplot 函数 将 一 个 图 形 窗口 划分 为 多 个 显示 区 域 ， 其 调用 格式 如 下 。 


subplot(m,n,p) 
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subplot 函数 将 图 形 窗口 划分 为 m GT) xn AD 个 显示 区 域 ， 并 选择 第 p 个 区 域 作 为 
当前 绘图 区 。 

(4) 图 像 文件 信息 的 合 询 

imfinfo 函数 用 于 查询 图 像 文件 的 有 关 人 信息， 详细 地 显示 出 图 像 文件 的 各 种 属性 。 其 语 
法 格式 为 : 


info=imfinfo(‘filename’,‘fmt’) 或 info=imfinfo(‘filename.fimt’) 




















uy imfinfo filename.fmt 


imfinfo 纯 数 获取 的 图 像 文件 信息 因 文 件 类 型 的 不 同 而 不 同 ， 但 至 少 应 包含 以 下 内 容 。 
> 文件 名 。 如 果 访 文件 不 在 当前 目录 下 ， 还 包含 该 文件 的 完整 路 径 。 




















> 文件 格式 。 

> 文件 格式 的 版 本 号 。 

> 文件 最 后 一 次 修改 的 时 间 。 

> 文件 的 大 小 。 以 字 节 为 单位 。 

> 图 像 的 宽度 。 

> BIR. 

> 每 个 像素 所 用 的 比特 数 。 也 叫 像 素 深 度 。 


Y 
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1.3.3 视 频 图 像 的 基本 操作 


视频 图 像 中 所 含 的 帧 数 、 每 帧 图 像 的 大 小 以 及 播放 的 速率 是 衡量 视频 图 像 的 重要 指标 。 
在 MATLAB 中 ， 提 供 了 AVIINFO(C) 函 数 来 获取 AVI 视频 的 信息 。 它 的 使 用 格式 如 下 。 


FILEINFO=AVIINFO (FILENAME) 


该 水 数 的 功能 是 返回 一 个 结构 体 ， 每 个 字段 都 包含 有 AVI 文件 的 信息 。 
例如 ， 在 MATALB 工作 窗口 中 输入 如 下 语句 。 


FILEINFO=AVIINFO('vipboard') 
运行 后 ， 输 出 文件 信息 如 下 。 


FILEINFO = 

% 视频 文件 的 名 称 及 存储 地 址 
Filename: 'CAProgramFilesMATLABWR201 0aXtoolboxvipblksWwipdemos wipboard.avi' 
% 文件 的 大 小 

FileSize: 29388288 

% 文件 生成 的 日 期 

FileModDate: '14-/\H -2009 00:10:02' 
% 视频 文件 所 包含 的 帧 数 
NumFrames: 340 

% 每 秒 钟 播放 的 帧 数 
FramesPerSecond: 30 

% tipi LER BS ST 

Width: 360 























Z415 EERE 





Height: 240 
% FERRI 
ImageType: 'indexed' 





% 视频 是 否 被 压缩 
VideoCompression: 'none' > 
% 图 像 的 质量 

Quality: 0 

% B^ rp BH Cs I A 

NumColormapEntries: 256 


在 MATLAB 中 ， 提 供 了 AVIREAD() 函 数 ， 它 可 以 将 一 个 AVI 文件 读 到 MATLAB 的 视 
频 结 构 中 ， 该 函数 的 用 法 如 下 。 


MOV= AVIREAD(FILENAME) 





NEM MATLAB 中 的 图 像 类 型 


(1) KERZ 
MATLAB 把 灰 度 图 像 存 储 为 一 个 数据 和 窍 阵 ， 该 怎 阵 中 元 素 的 大 小 分 别 代表 了 图 像 中 像 
素 的 灰 度 值 。 窍 阵 中 的 元 系 可 以 是 双 糊 度 的 浮 点 型 、8 位 或 16 位 无 符号 的 整数 类 型 。 





(2) RGB 图 像 

RGB 网 像 ， 即 真 彩 网 像 ， 在 MATLAB 中 存储 为 数据 和 矩阵。 和 矩阵 中 的 元 素 定 义 了 图 像 中 
每 一 个 像素 的 红 、 绿 、 赣 颜色 值 。 像 素 的 颜色 由 保存 在 像素 位 置 上 红 、 绿 、 赣 的 灰 度 值 的 组 
合 来 确定 。 

MATLAB 的 真 彩 图 像 矩 阵 可 以 是 双 精 度 的 浮 点 型 数 、8 位 或 16 位 无 符号 的 整数 类 型 。 
在 真 彩 图 像 的 双 精 度 型 数组 中 ， 每 一 种 颜色 是 用 0 和 1 之 间 的 数值 表示 。 例 如 ， 颜 色 值 是 
(0，0，0) 的 像素 ， 显 示 的 是 黑色 ;颜色 值 (1，1，1) 的 像素 ， 显 示 的 是 白色 。 每 一 像素 
的 三 个 颜色 值 保 存在 数组 的 第 三 维 中 。 例 如 ， 像 素 (10，5) 的 红 、 绿 、 赣 颜色 值 分 别 保存 
在 元 素 RGB (10，$，1)、RGB (10, 5, 2), RGB (10, 5, 3) 中 。 

(3) 二 值 图 像 

与 灰 度 图 像 相 同 ， 二 值 图 像 只 需要 一 个 数据 耸 阵 ， 每 个 像素 只 取 两 个 灰 度 值 (0 或 1)。 
二 值 图 像 可 以 采用 unit8 或 double 类 型 存储 。 

(4) 索引 图 像 

索引 网 像 包 括 一 个 数据 矩阵 X， 一 个 颜色 映像 矩阵 Map。 其 中 ，Map 是 一 个 包含 三 列 和 
若干 行 的 数据 阵列 ， 其 每 一 个 元 素 的 值 均 为 [0,1] 之 间 的 双 精 度 浮 点 型 数据 。Map 和 矩阵 的 每 
一 行 分 别 为 红色 、 绿 色 、 蓝 色 的 颜色 值 。 在 MATLAB 中 ， 索 引 图 像 是 从 像素 值 到 颜色 映射 
表 值 的 直接 映射 。 像 素颜 色 由 数据 窍 阵 X 作为 索引 指 问 矩阵 Map 进行 索引 。 例 如 ， 值 1 指 
HERE Map 中 的 第 一 行 ，2 指向 第 二 行 ， 以 此 类 推 。 


LOUPE 体验 数字 图 像 处 理 


讲 到 这 儿 ， 我 想 大 家 已 经 进 个 及 行 地 想 要 体验 数字 图 像 处 理 的 编程 了 ， 束 让 我 们 通过 
下 面 的 两 段 MATLAB 例 程 来 巩固 本 市 所 学 的 知识 吧 。 请 读者 注意 体会 数字 图像 处 理 的 核 
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例 程 1-1 


例 程 1-1 实现 的 是 绘制 


LLEELLELLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL 


a-zeros(64,64); 。”% 建 立 64x64 的 矩阵 
for 171:64 

for j71:64 

a(1,])-1; 

end 
end 
image(a) 
K KK K K K K K K K K K K K K K K K K K K K K K K K FK K K K K FK K K K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK ÞK FK FK K FK K FK K K K K 3K K K K 








图 1-16 所 示 。 
例 程 1-2 


K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K FK K K FK K FK FK K FK K FK K FK FK K FK K FK FK K FK ÞK FK FK K K K FK K K K K FK K K K 
% 恋 入 图 像 并 显示 

I-imread('study.jpg); 

I-rgb2gray(I); 

imshow(I) 


% 获得 图 像 的 行列 数 ， 并 存 入 矩阵 s P. sd, NÆRMARE RERIT s(1,2)29 BRE RERI ZI 
s—size(I); 

% 转换 成 双 精 度 型 ， 才 能 进行 代数 运算 

I-double(I); 





% 用 该 图 像 内 2x2 块 的 平均 像素 代 督 2x2 块 内 的 所 有 像素 
for 1=1:2:s(1,1) 
for J=1:2:s(1,2) 
sum=I(i,j)+IG+1,)+IG,+1)+IG+1,j+1); 
1(1,])=sum/4; 
I(1*1,j)-sum/4; 
I(1,j- 1)7sum/4; 
I(1*1,j7-1)-sum/A; 
end 
end 





% 将 数组 1 转换 为 8 位 无 人 符 写 整 型 ， 用 于 图 像 显 未 

l=uint8(]1); 

figure 

imshow(I) 
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以 上 程序 实现 的 是 读 入 一 幅 文 件 名 为 study.jpg 的 图 像 ， 并 以 该 图 像 内 2x2 RIFIZ 





AVE; 2x2 块 内 的 所 有 像素 ， 运 行 效果 如 图 1717 HR. 











dà 64x64 垂直 色彩 灰 度 渐变 的 数字 网 像 ， 其 运行 效果 如 
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1-16 PJE 1-1HpestfraR 





1-17 Jf 1-2 的 运行 效果 
a) 输入 的 原始 图 像 b) 运行 后 的 结果 
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第 2 章 数字 图 像 变换 


本 章 导 读 

通过 对 第 1 草 的 学 习 我 们 知道 ， 一 幅 数 字 几 像 可 以 用 一 个 矩阵 来 表示 ， 对 数字 网 像 进行 
处 理 ， 实 质 上 恕 是 对 特定 的 图 像 矩 阵 进行 变换 的 过 程 。 因 此 ， 疼 像 变 换 是 数字 图 像 处 理 拉 术 
的 基础 。 

在 工程 实践 中 ， 疼 像 通 过 变换 ， 改 变 的 表示 域 或 数据 表示 形式 ， 会 给 后 续 问 题 的 处 理 市 
来 极 大 的 方便 。 例 如 ， 离 也 余 弦 变 换 可 以 使 图 像 的 能 量 集 中 在 少量 数据 上 ， 方 便 数 据 压 绚 ， 
为 实现 高 效 的 图 像 传 输 和 存储 竟 定 基础 ，Hough 变换 利用 点 一 线 的 对 应 关系 ， 可 以 准确 地 检 
测 出 图 像 中 的 直线 特征 ， 在 智能 交通 中 应 用 广泛 。 如 采用 生活 中 的 一 句 话 来 直观 地 描述 图 像 
变换 ， 那 就 是 “换个 角度 看 问题 ， 便 会 海阔天空 ”。 

目前 ， 图 像 变 换 有 多 种 方法 。 本 草 将 这 些 方法 分 门 别 类 ， 系 统 、 消 晰 地 呈现 给 读者 ， 内 
容 安排 如 表 2-1 Tn. 





























表 2-1 92:Wesff 


空间 域 变 2. 
2. 


DTI 
x 








图 频率 域 变换 235. 23 5 
像 空间 域 、 频 率 域 滤波 24 节 





读者 在 学 习 本 半 时 ， 应 注意 总 结 每 种 图 像 变 换 方法 的 特点 ， 以 便 在 实际 应 用 中 根据 需要 
选择 合理 的 方法 或 综合 运用 多 种 方法 解决 问题 。 


2.1 图 像 的 空间 变换 
2.1.1 [5115 89/L [n] 3p 35 


(1) 图 像 的 平移 变换 

平移 是 日 常生 活 中 最 普 表 的 方式 之 一 ， 如 开学 时 教室 里 诛 虹 的 重新 摆 放 等 虱 可 以 视 为 平 
移 运 动 。 图 像 的 平移 是 将 一 幅 图 像 上 的 所 有 像 聚 点 部 按 给 定 的 仿 移 量 党 x 方 回 和 yy 方向 进行 
移动 ， 如 图 2-1 所 示 。 图 像 的 平移 变换 是 网 像 儿 何 变换 中 最 简单 的 变换 之 一 。 

HERTA Moyo) 进行 平移 后 ， 和 被 移动 到 4(z, 切 的 位 置 ， 其 中 ，x 方 回 上 的 平移 量 为 
Ar ，J 方 向 上 的 平移 量 为 Ay ， 则 点 Ax, y) 的 坐标 为 : 
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图 2-1 图 像 平移 示意 图 
利用 齐 次 坐标 ， 点 AQ y) 的 坐标 可 以 表示 如 下 。 


ni M 
oh 1 os 
相应 地 ， 也 可 以 根据 点 Ax, y) 求解 原始 点 A Xo Yo) PABER, BN 
Xp 1 0 -Ax|(x 
Yo |*|0 1 -Ay| y 
l 00 1 AI 
AEN. DÀ EPSAR ARTS VE HO CRB B 
图 像 平移 变换 的 特点 是 平移 后 的 图 像 与 原 图 像 完 全 相同 ， 平 移 后 狐 图 像 上 的 每 一 点 都 可 
以 在 原 图 像 中 找到 对 应 的 点 。 对 于 不 在 原始 图 像 中 的 点 ， 可 以 直接 按 它 们 的 像素 值 统 一 设置 
为 0 或 255， 对 于 灰 度 图 像 则 为 黑色 或 白色 。 反 之 ， 若 某 像素 点 不 在 狐 图 像 中 ， 同 样 说 明 原 
始 图 像 中 有 某 些 像素 点 被 移出 了 显示 区 域 。 图 像 经 平移 后 ， 原 始 图 像 的 一 些 像素 点 被 移出 了 
显示 区 域 ， 奉 想 你 留 全 部 图 像 ， 则 应 扩大 新 图 像 的 显示 区 域 。 
例 程 2-1 是 图 像 平 移 的 MATLAB 程序 ， 其 运行 过 程 如 图 2-2a 所 示 ， 其 运行 结果 如 
图 2-2b 所 示 . 
例 程 2-1 
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function outimage-imtranslateli(I,deltax,deltay,zoo) 
% 功 能 

% 输 入 : 天 输入 的 待 处 理 的 网 像 

% deltax- 沿 x 轴 的 偏 移 量 

% deltay- 治 y HIT fi E 

% z00- 扩 大 因子 

% 输 出 : outimage- 输 出 的 平移 后 的 图 像 


[m,n]-size(I); 
VoIHLAE 6 153) ABUS SX IBI ANT X 


zoom-0; 





if nargin23 


% 画 布 扩大 
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Zoom-zoo; 
end 
if zoom 
outimage-zeros(m--deltax,n--deltay); 
else 
outimage-zeros(m,n); 
end 
% 处 理 后 图 像 初始 化 
[m0 n0]=size(outimage); 
for y=1:n0 
for x=1:m0 
x0-x-deltax; 
y0=y-deltay; 
if x0>=] &&x0<=m&&y0>=] &&y0<=n 
% 给 新 图 像 中 的 像素 赋值 
outimage(x,y)-1(x0,y0); 
end 
end 
end 


% 显 示 图 像 
subplot(121),imshow(L)title(' 5 45; BSN; 
subplot(122), imshow(uint8(outimage)),title( 平 移 后 的 图 像 ); 
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[Command Window CEXGENEE aookspace cc A XJ 
aU to NATLAB? Watch this Video, see Demos, or read Getting Started X mÍ m8 T | stack: | AE Select data to plot ~ 
>> I-imread( hual. jpg ) ; | Min | Max | 
>> I=rgb2gray (I) ; H1 (384x512 uint8? 1 255 j| 
>> outimage-imtranslateli(I, 50, 50, 1); EE] outimage 434x582 double? 0 255 
f» 
a) 


原始 图 像 平移 后 的 图 像 





图 2-2 图 像 平 移 的 MATLAB 程序 
a) 平移 的 运行 过 程 b) 平移 的 运行 结果 
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(2) 图 像 比 例 变换 

通 和 情况 下 ， 数 字 图 像 的 比例 缩放 是 指 给 定 的 图 像 在 x* 方 同和 了 方 癌 按 相同 的 比例 缩放 
a 倍 ， 从 而 获得 一 幅 新 的 图 像 ， 又 称 为 全 比例 缩放 。 如 果 x 方 向 和 yy 方向 缩放 的 比例 不 同 ， 
则 图 像 的 比例 缩放 会 改变 原始 图 像 像 素 间 的 相对 位 置 ， 产 生 几 何 畸 变 。 假 设 原 始 图 像 中 的 点 
Ay G9, yo) EG] AR UR. EEG SR HP IDE IRA AQ y) o W AS Q9. y) M A, y) IRI] AE 


标 关 系 可 表示 为 
n a 0 Oj(x, 
Srt ge 
l 0 0 1j\1l 


m ed. 
^ = 4yo 
Er EPA SUE EWER A BERE s E Js ER. P SCHEDE NES ER RARE» W m ETAK 
度 值 的 插值 运算 ， 一 和 股 有 以 下 两 种 插值 处 理 方法 。 
1) 直接 赋值 为 和 它 最 相近 的 像素 大 上 度 值 ， 这 种 方法 称 为 最 邻近 插值 法 C Nearest 
Neighbor Interpolation)， 该 方法 的 主要 特点 是 向 单 、 计 算 量 很 小 ， 但 可 能 会 产生 马赛 区 现象 。 
2) 通过 其 他 数学 插值 算法 来 计算 相应 的 像素 点 的 灰 度 值 ， 这 类 方法 处 理 效 末 好， 但 运 
量 会 有 所 增加 。 
有 关 灰 度 插值 的 内 容 ， 将 在 本 市 的 2.1.2 B XETTVESI TT 28. 
ÆA (2-1) 所 表示 的 比例 缩放 中 ， 和 条 a>1， 则 图 像 被 放大 ; diac. MWERA 
以 a=1/2 为 例 ， 即 图 像 缩小 为 原始 图 像 的 12。 图 像 被 缩小 L2 以 后 根据 目标 图 像 和 原始 图 
像 像素 之 间 的 关系 ， 有 如 下 两 种 抛 小 方 读 。 
第 1 种 方法 是 取 诛 始 网 像 的 偶数 行 和 偶数 列 组 成 新 的 图 像 ， 缩 放 前 后 图 像 间 像 素 点 的 对 
应 关系 如 下 。 














e» 


(2-1) 









































(0,0) <> (0,0) 
(0,1) <> (0,2) 
(0,2) < (0,4) 
(0,3) <> (0,6) 
(1,0) < (2,0) 
缩小 图 像 4(2,0) e (4,0) ;原始 图 像 
(3,0) <> (6,0) 
(3, e (6,2) 
(3,5) €» (6,4) 
(3.3) €» (6,6) 
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以 此 类 推 ， 可 以 逐 氮 计算 缩小 后 岁 像 各 像素 氮 的 什 ， 网 像 缩小 之 后 所 承载 的 信息 量 为 怕 
始 图 像 的 23% ， 即 在 原始 图 像 上 ， 控 行 优先 的 原则 ， 对 所 处 理 的 行 ， 每 隅 一 个 像 系 取 一 扩 ， 
每 隅 一 行进 行 一 次 操作 。 力 一 种 方法 是 取 原 始 图 像 的 奇数 行 和 奇数 列 组 成 新 的 图 像 。 

如 果 图 像 按 任意 比例 绚 小 ， 则 以 类 似 的 方式 按 比例 选择 行 和 列 上 的 像 聚 后。 夺 x 方 问 与 
y 方 同 绚 放 的 比例 不 同 ， 则 这 种 变换 将 会 使 纠 放 以 后 的 图 像 产 生 儿 何 辐 变 。 图 像 x 方 回 与 y 
方 问 的 不 同比 例 缩放 的 变换 公式 如 下 。 
































Xo 
Yy | a+b 2-2) 


Fc A] Ae HE CUR ERR f P RERA aO PET ERE f s Zo BRIA 
AE 3 WU] ris 206] EHE S S] ES BUN 8 DT Se EA DIEI CR ARAE HOO KERR sot Jun ER 
像 中 没有 直接 对 应 点 ， 需 要 以 东 种 方式 进行 估计 。 以 ac=2=2 为 例 ， 即 原始 图 像 按 全 局 比例 
放大 2 倍 ， 实 际 上 ， 这 是 将 原始 岁 像 每 行 中 各 像素 点 重复 取 一 轴 值 ， 然 后 每 行 重复 一 次 。 根 
据 理 论 计算 ， 放 大 以 后 图 像 中 的 像素 点 (0,0) 对 应 于 原始 图 像 中 的 像素 点 (0,0) ，(0,2) 对 应 于 
原始 图 像 中 的 像素 点 (0,1) ， 但 放大 后 图 像 的 像 桶 点 (0,1) 对 应 于 原始 图 像 中 的 像 取 点 
(0,0.5) ，(1,0) 对 应 于 原始 图 像 中 的 (0.5,0) ， 原 始 赂 像 中 不 存在 这 些 像素 点 ， 那 么 放大 后 的 
图 像 如 何 处 理 这 些 问 题 呢 ? 以 像 隶 点 (0,0.5) 为 例 ， 这 时 可 以 采用 以 下 两 种 方法 和 原始 图 像 对 
应 ， 其 余 挟 依 此 类 推 。 

1) 将 原始 图 像 中 的 像素 点 (0,0.5) 近似 为 原始 图 像 的 像素 点 (0,0) 。 

2) 将 原始 图 像 中 的 像素 点 (0,0.5) 近似 为 原始 图 像 的 像素 点 (0,1) 。 

各 采用 第 1 种 方法 ， 则 原始 图 像 和 放大 图 像 的 像素 点 对 应 关系 如 下 。 




















(0,00 <> (0,0) 
(00) <> (0,0) 
(1,0) <> (0,0) 
(1,1) < (0,0) 
(2,2) < (LD 
放大 图 像 1 9 O OD gue 
(3,2) e (Ll) 
(3,3 o (Ll) 
(4,4 < (2,2) 
(4,5) < (2,2) 
(5,4 < (2,2) 


(5,5) eo (2,2) 


各 采用 第 2 种 方法 ， 则 原始 图 像 和 放大 图 像 的 像 聚 点 对 应 关系 如 下 。 
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(0,0) <> (0,0) 
(01) < (0,D 
(LO e (L0) 
(LI) «€» (LI) e 
(L2 e (LD 
(2,.) eo (LD 
2,2 o (LD 
(2,3 e (LD 
放大 图 像 ,(G3,2) e D ;原始 图 像 
(3,3 o (LD 
(3,4 e (2,2) 
(4,3 e (2,2) 
(44) <> (2.2) 
(5.5 «e (3,3) 
(56 e (3,3) 
(63) © (3,3) 
(66) <> (3,3) 





TE P. TRECE AR REINA a 倍 时 ， 如 条 按照 最 近邻 域 法 ， 则 需要 将 一 个 像素 
值 添 到 新 图 像 的 axa 的 方块 中 。 因 此 ， 如 果 放 大 倍数 过 大 ， 则 按照 这 种 方法 填充 灰 度 值 会 
出 现 马赛 克 效 应 。 为 了 避免 马赛 殉 效 应 ， 提 高 儿 何 变换 后 的 岁 像 质 量 ， 可 以 采用 不 同 复杂 程 
度 的 线性 插值 法 填充 放大 后 所 多 出 来 的 相关 像素 点 的 灰 度 值 。 

例 程 2-2 

例 程 2-2 实现 的 功能 是 将 图 像 进行 图 像 缩小 或 放大 的 MATLAB 源 程序 ， 其 运行 过 程 如 
图 2-3a 所 示 ， 原 始 图 像 如 图 2-3b 所 示 ， 缩 小 后 的 图 像 及 其 运行 结果 如 网 2-3c 所 示 。 
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function newImage-resamplel(image,newRow,newCol) 
% 功能 : 对 图 像 进 行 缩放 

% 输入 : image- 和 需要 进行 缩放 的 灰 虐 图 像 ; 

% newRow-Afi E ir EVER TT AG 

% newCol- 缩 放 后 新 图 像 的 列 数 ， 

% 输出 : newImage- 缩 放 后 的 图 像 。 


[row,col]-size(image); 
image larger-zeros((row--1),(col--1)); 
image larger(1:row,1:col)-image; 
image-image larger; 
newImage-zeros(newRow,newCol); 
for 1-0:(newRow-1) 
for j70:(newCol-1) 
x-j*(col-1)/(newCol-1); 
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y-i*(row-1)/(newRow- 1); 
fx-floor(x); 
fy-floor(y); 


area ul-(x-fx)*(y-fy); 

area ur-(fx1-x)*(y-fy); 
area bl-(x-fx)*(fy*1-y); 
area br=(fx+1-x)*(fy+1-y); 


newImage(1-1,j*1)-... 
image(fy+1,fx+1)*area_br+... 
image(fy+1,fx+2)*area_bl+... 
image(fy+2,fx+1)*area_ur+... 
image(fy+2,fx+2)*area_ul; 
end 


end 
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| Command Window 






MD select data to plot 
| Value | Min | Max 
X480x540 uint? 4 222 

K240x320 double? 10.6094 2189. 


>> I-imread( hua2. jpg’); 

>> I-rgb?2gray(l): 

>> newImage-resamplel(I, 240, 320) ; 
>> imshow(I): 

>> figure 


newImage 


>> imshow(uint8 (newImage)); 


f » 


Figure 1 
ile Edit View Insert Tools Desktop Window Help 
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X480x640 uint8» 1 
X240x320 double? 10.6094 218.... 


Figure 2 
File Edit View Insert Tools Desktop Window Help 
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b) c) 
2-3 缩小 或 放大 的 MATLAB 源 程序 
a) 例 程 2-2 的 运行 情况 b) 输入 的 原始 图 像 c) Hir S BS ROS TT ZG AR 


在 MATLAB 中 ， 图 像 的 缩放 也 可 以 调用 imresize 函数 来 实现 。imresize 函数 的 调用 格式 
如 下 。 
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B = imresize(A,m,method) 


imrersize 函数 使 用 由 参数 method 指定 的 插值 运算 来 改变 图 像 的 大 小 。method 的 儿 种 可 选 值 
为 : mearest( 默 认 值 ) 最 近邻 插值 ; 'bilinear 双 线性 插值 ; 'bicubic' 双 三 次 插值 ; B = 
imresize(A,m) 表 示 把 图 像 A 放大 m 倍 。 © 

例 程 2-3 
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I=imread('hua3.jpg'); 
I-rgb2gray(l); 


Xl-umresize(12); % 放 大 为 原来 的 2 fi 
X2-imresize(1,0.5); % 缩 小 为 原来 的 1/2 
figure,1mshow(X1); 

figure,1mshow( X2); 
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例 程 2-3 是 调用 imresize 函数 进行 图 像 缩 放 的 MATLAB 程序 ， 其 运行 结果 如 图 2-4 所 示 。 


File Edit View Insert Tools Desktop Window Help 


nduHaj|bj&eosez-ja nga 


<341x455 uint» 
«582x910 uint8> 
4111x228 uint8> 


File Edit View Insert Tools De T Window 





2-4 WIFE 2-3 的 运行 结果 


(3) 图 像 旋 转变 换 

提 到 旋转 ， 首 先 要 解决 “ 绕 着 什么 转 ” 的 问题 。 通 常 的 做 法 是 ， 以 图 像 的 中 心 为 圆心 旋 
转 ， 将 图 像 上 所 有 像素 都 旋转 一 个 相同 的 角度 。 图 像 的 旋转 变换 是 图 像 的 位 置 变换 ， 但 旋转 
后 图 像 的 大 小 一 般 会 改变 。 和 图 像 平 移 变 换 一 样 ， 在 图 像 旋 转变 换 中 ， 可 以 把 转 出 显示 区 域 
的 几 像 蕉 去， 旋转 后 也 可 以 扩大 图 像 范围 以 显示 所 有 的 图 像 。 

采用 不 裁 挥 转 出 、 部 分 旋转 后 图 像 放 大 的 做 法 ， 首 先 需要 给 出 变换 和 矩阵。 在 坐标 系 中 ， 
将 一 个 点 顺 时 针 旋 转 a 角 ，r 为 该 点 到 原点 的 距离 ，b 为 + 与 x 轴 之 间 的 夹 角 。 在 旋转 过 程 
中 ，r 保 持 不 变 。 

WEB x, yo 的 坐标 分 别 为 x 9 rcosb, yy-rsinb. "DE a AR, "sx. y 
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的 值 分 别 为 


x -rcos(b—a)-rcosbcosa * rsinbsina = x, cosa + y sina 


(2-3) 
y, =rsin(b-a)=rsinbcosa -r cosbsina =-—x sina + yy cosa 


DIAE PEIE KZI N 


cosa -sina 0 
(x » D=(X% y 1)|sina cosa 0 


0 0 l 


fEXX (2-4) 中 ， 坐 标 系 xOy 是 以 图 像 的 中 心 为 原 后， 以 右 为 x 轴 正 方 同 ， 以 上 为 y 轴 正方 
|] o 


设 图 像 的 宽度 为 ww ， 高 度 为 户 ， 容 易 得 到 


(2-4) 


] 0 0 
(x y D=x y D 0 -] 0 (2-5) 
—0.5w O.5h 1 
逆 变 换 为 
] 0 0 
(x y D2(x y D| 0 -] 0 (2-6) 
0.5w 0.5h 1 


ATI (273) ~ 式 (2-6)， 可 以 将 旋转 变换 分 成 3 个 步骤 来 完成 : 
1) 将 坐标 系 x'O'y' 变 成 xOvy 。 


2) 将 该 点 顺 时 针 旋 转 a ffi. 


3) 将 坐标 系 xOy Æ x'O'y' ， 这 样 ， 融 得 到 了 如 下 的 变换 矩阵 《是 上 面 3 个 矩阵 的 
级 联 ): 


l 0 0 \/ cosa -sina O0 1 0 0 
(x y 1)=(x y D 0 -1 0 || sina cosa 0 0 一 ] 0 
—-0.5w,, Us 1 0 0 10. Sw,, OSh,, 1 
cosa sin a 0 
-(x, yy D) -sina cosa 0 


—0.5w, COSA + —0.5w q sina 一 


1 
0.5h u sina + 0.5Sw en O.Sh y cosa + O.Sh ow 


(2-7) 
AH, Wold ? ha Lm hew 4] Az I5 SR HI TE 高 和 新 图 像 的 宽 、 Ie 式 (2=7) H3 39i 
变换 为 
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] 0 Ol cosa sina 0 ] 0 0 
(x9 yy; D=% 4 D 0 -] 0| -sina cosa 0 0 一 ] 
-0.3W ew 0.5h 1 0 0 1 八 0.3w 0.5h 1] 
cosa -sina 0 > 
=(X y D sina cosa 0 
—0.5w cosa — 0.5w,,,, Sina — 


0.5h e Sina 0.5w,, O.Sh y cosa O.Sh ia 


(2-8) 

这 样 ， 对 于 狐 图 像 中 的 每 一 点 ， 就 可 以 根据 式 (2-8) 求 出 对 应 点 原 图 像 中 的 点 ， 并 得 
到 筷 的 灰 度 。 如 果 超 出 原 网 像 范 围 ， 则 填 成 白色 。 要 注意 的 是 ， 由 于 有 译 点 运算 ， 计 算出 来 
的 点 坐标 可 能 不 是 整数 ， 需 要 采用 取 整 处 理 ， 即 找到 最 接近 的 点 ， 这 样 会 带 来 一 些 误差 (图 
像 可 能 会 出 现 锯齿 )。 更 精确 的 方法 是 采用 插值 ， 这 将 在 2.1.2 小 市 中 进行 介绍 。 

FE 2-4 是 将 图 像 进 行 旋转 的 MATLAB 源 程序， 其 运行 过 程 如 图 2-5a 所 示 ， 其 输入 的 
原始 图 像 如 图 2-5b 所 示 ， 其 运行 结果 如 图 2-5c 所 示 。 

例 程 2-4 


KK K K K K K K K K K K K K K K ÞK K K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK K K K K FK K K K K K ÞK ÞK K K FK FK FK FK FK FK K K K K K K K 




















function r-imrotateli(Ltheta) 

% 功能 : 对 输入 的 灰 度 图 像 进行 旋转 
% 输入 : I 每 旋转 的 灰 度 图 像 

% theta- 旋 转 的 角度 

% 输出 : 六 旋转 后 的 图 像 


[h0 w0]=size(1); 
theta=(theta*p1/180); 
cosa=cos(theta); 
sina=sin(theta); 


% 图 像 原 四 个 顶点 坐标 
srcx1—-w0*0.5;srcy1—h0*0.5; 
Srcx2—w0*0.5; srcy2—-h0*0.5; 
SICX3—-w0* 0.5; srcy3—-h0*0.5; 
srcx4—w0*0.5; srcy4—-h0*0.5; 


% EVE iE e Jes PUT TUE s A 
dstx 1—cosa*srcx1-sina*srcyl; 
dsty 1l -sina*srcex 1 -cosa*srcyl; 
dstx2—cosa*srcx2-sina*srcy2; 
dsty2-sina*srcx2--cosa*srcy2; 
dstx3—cosa*srcx3-sina*srcy3; 
dsty3-sina*srcx3--cosa*srcy3; 
dstx4—cosa*srcx4-sina*srcy4; 
dsty4—sina*srcx4--cosa*srcy4; 
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在 MATLAB 中 ， 图 像 的 旋转 也 可 以 通过 直接 调用 imrotate 函数 来 实现 ， 其 调用 格式 为 : 


上 上述 函数 以 图 像 中 心 点 为 基准 ， 以 角度 angle 逆 时 针 方向 旋转 。 指 定 angle 为 负 值 ， 





% 计算 旋转 后 图 像 的 宽度 与 局 度 

% 旋转 后 图 像 的 高 为 对 应 顶点 纵 坐 标 之 差 的 较 大 值 
h=max(abs(dsty4-dsty 1 ),abs(dsty2-dsty3))+0.5; 

% 旋转 后 图 像 的 宽 为 对 应 顶点 纵 坐 标 之 差 的 较 大 值 
w=max(abs(dstx4-dstx 1),abs(dstx2-dstx3))+0.5; 








% KI ERAI A TET] UE AN BTE 
h-floor(h); 
w-floor(w); 


r-zeros(h,w); 

% 计算 两 个 常数 
fl=-w*0.S*cosa-h*0.S*sinat+0.S*wO; 
f2=w¥*¥0.5*sina-h*¥0.5*cosa+0.5*h0; 


for x=1:w 
for y=1:h 
x0=floor(x*cosa+y*sina+f1); 
y0=floor(-x*sinaty+cosa+f2); 
% ORE RETI HUS 
if x020& &x0«—wÜ0&&y0-0&&y0--—hO0 
r(y,x)-1(y0,x0); 
end 
end 
end 
% 显示 原始 图 像 及 变换 之 后 的 图 像 
subplot(121), imshow(I); 
subplot(122), imshow(tr,[]); 





% 坐标 值 必须 为 整数 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K FK FK K FK K K K K ÞK ÞK K FK FK FK FK FK FK K K K K K K 2K 


B = imrotate(A,angle) 


可 实现 图 像 顺 时 针 旋 转 。 


例 程 2-5 是 调用 imrotate KA HEIT EL UA d] MATLAB 程序 ， 其 运行 结果 如 图 2-6 


PES 








Command Window 


>> I-imread( huad. jpg); 
>> I-rgb2gray(l):; 
>> r-imrotateli(I, 30); 


fx» 





a) 


ITE YE 





| Value 
<480xB40 uint» 
<T3BxT94 double? 


2-5 对 图 像 进行 旋转 


a) 例 程 2-4 的 运行 情况 


0 


«Too... 


254 
«Too... 


MO Select data to plot X 


| Min | Max 
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b) c) 
图 2-5 对 图 像 进行 旋转 〈 续 ) 
b) 输入 的 原始 图 像 © 例 程 2-4 的 运行 结果 及 其 旋转 后 的 图 像 


例 程 2-5 
KOK K K K K K KK K K K K K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 3K K 
I=imread('hua5.jpg'); 
I=rgb2gray(1); 
subplot(141),imshow(D,title( JR 48 Ed ff"); 


Xl -imrotate(1,30,'nearest"); % 旋 转 30° 
subplot(142),imshow(uint8(X1)); title(' 旋 转 30 E"); 
X2-umrotate(1,745,'nearest"); Vo)ETE-45^ 
subplot(143),imshow(uint8(X2)); title(' 旋 转 -45 FE"); 
X3-imrotate(1,60,' nearest"); % 旋 转 60° 


subplot(144),imshow(uint8(X3)); title( 旋 转 60 度 ); 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK ÞK K K K K FK K K K K K K ÞK K K FK FK FK FK FK FK K K K K K K K 


原始 图 像 


p l 旋转 30* 


旋转 60° 





图 2-6 例 程 2-5 的 运行 结果 


4) 图 像 镜像 变换 

图 像 的 镜像 (Mirror〉 变换 不 改变 图 像 的 形状 。 图 像 的 镜像 变换 分 为 3 种 ， 水 平 镜像 、 
垂直 镜像 和 对 角 镜 像 。 

设 图 像 的 水 平 镜像 操作 是 将 图 像 左 半 部 分 和 右 半 部 分 以 图 像 垂 直 中 轴线 为 中 心 进行 镜像 
对 换 。 设 图 像 的 大 小 为 M x N ， 水 平 镜像 可 按 式 〈2-9) 计算 : 
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Pn (2-9) 
j2N-j-«l 

AF, G0, ABREN FG, 站 中 像素 点 的 坐标 ;，(, 门 为 对 应 像素 点 Gi, 站 水 平 镜 像 变 换 后 
E HG, 门 中 的 坐标 。 设 原始 图 像 的 矩阵 为 


fi fo fs fa fs 
Ín Ja Ja Ja fs 
F=f fo Ja fa fs (2-10) 
fa fo fa fa fas 
Ja fa Js fu fs 
经 过 水 平 镜像 的 图 像 ， 行 的 排列 顺序 保持 不 变 ， 将 原来 的 列 排列 j=1,2,3,4,5 转换 成 
31 2543.2 Lx Bl 





fs fa fs fo fu 
hs fa fm fm fn 
H = fs fis fsz "E hı 
fas Jas fa pn fa 
Sss fa fs fs fs 
图 像 的 垂直 镜像 操作 是 将 图 像 上 半 部 分 和 下 半 部 分 以 图 像 水 平 中 轴线 为 中 心 进行 镜像 对 
换 。 设 图 像 的 大 小 为 M xN ， 垂 直 镜 像 可 按 式 (2-11) 计算 : 
i-M-i-«l 
AP, 0, EUER FG, 站 中 像素 点 的 坐标 ;，(7', 为 对 应 像素 点 (i 7) E ELSE TRUE 
BR HQ, 站 中 的 坐标 。 
设 原始 图 像 的 矩阵 如 式 (2-100 所 示 ， 经 过 垂直 镜像 的 图 像 ， 列 的 排列 顺序 保持 不 变 ， 
将 原来 行 的 排列 i=1,2,3,4,5 转换 成 '=5,4,3,2,1， 即 


Ja fo Js fu fs 

fa fo fa Ju fa 

H-ifa fo fes fa fs 

Ja Ja fm fu fs 

fi fa fa fa hs 
图 像 的 对 角 镜像 操作 是 将 图 像 以 图 像 水 平 中 轴线 和 垂直 中 轴线 的 交点 为 中 心 进行 镜像 
对 的。 相当 于 先 水 平 镜像 、 后 垩 直 镜 像 。 设 图 像 的 大 小 为 M x N ， 对 角 镜 像 可 按 式 (2-12) 

sts 








(2-11) 











"—M-i-«l 
| ' (2-12) 


j2N-j4l1 
AU. (i DARES FG, j) 中 像素 点 的 坐标 ; 5, 门 为 对 应 像素 氮 仿 妃 对 角 镜 像 变 换 后 
RS HG, 让 中 的 坐标 。 设 原 图 像 的 矩阵 如 式 (2-10〉 所 示 ， 经 过 对 角 镜 像 的 图 像 ， 将 原来 
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的 行 排列 ;=123,4.5 转换 成 =5,4,3,2,1 ， 将 原来 的 列 排列 j=1,2,3,4,5 转换 成 
j'25,4,3,2,1 ,. BẸ 





Sss fa fs fa fs 
fs fa fa fo fa D 
H = fs faa fa3 "E hı 
has Jas Ta Ja Ja 
fs fa hs fo fu 
例 程 2-6 是 进行 图 像 镜 像 变换 的 MATALB 源 程序 ， 其 运行 过 程 如 图 2-7a 所 示 ， 运 行 结 
果 如 图 2-7b 所 示 。 
例 程 2-6 


KK K K K K K K K K K K K K K K K ÞK K K K K K K K K K K ÞK K K K K K K K K K K K K ÞK K K K FK FK FK FK K K K ÞK ÞK K K FK FK FK FK FK FK K K K K K K K 








function outimage-immirrli(Image,direction) 
% 功能 : 实现 图 像 的 镜像 变换 : ZO BIERTEIA. ETDBSBURIR. MERR 
% 输入 : Image- 行 变换 的 灰 度 图 像 


% direction-'horizontal' 水 平 镜 像 变 换 ; 
% —vertical' E H Ei AE d; 
% -both' XX In] gi AE T5; 


% 输出 : outimage- Ei | 


[M,N]-size(Image); 
outimage-zeros( M,N); 
if nargin--1 
direction-"'horizontal'; 
end 
% 计算 输出 图 像 
for x=1:M 
for y=1:N 
switch direction 
case 'horizontal' 
x0-x;y0-N-y-l; 
case 'vertical' 
x0=M-x+1;y0=y; 
case 'both' 
x0=M-x+1;y0=N-y+1; 
end 
% 给 新 图 像 中 的 像素 赋值 
outimage(x,y)-Image(x0,y0); 
end 


end 


KK K K K K K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK ÞK FK FK FK FK FK FK FK K K K K K K K 





"P MATLAB sess 





Command Window 





图 EE | HR | Stack: | MO select data to plot 
Name 4 | Value | Min | Max 
4560x420 uint? 4 255 
60x420 double? 4 255 


>> I=imread{ huaB. jpg’); 

>> I-rgb2gray(l); 

>> outimage-immirrli(I,' vertical’ ); 

>> subplot 1, 2, 1), imshow {I} ; 

>> subplot itl, 2, 2), imshow(uint8 (outimage)); 


fx» 





a) 





b) 
2-7 图 像 镜 像 变 换 


a) 例 程 2-6 的 运行 情况 b) 例 程 2-6 的 运行 结果 






2.1.2 你 度 级 插值 | 


在 进行 图 像 的 比例 缩放 、 旋 转 及 复合 变换 时 ， 原 始 图 像 的 像素 坐标 (x,y) 为 整数 ， 而 变 
换 后 目标 图 像 的 位 置 坐标 并 非 整 数 ， 反 之 亦 然 。 因 此 ， 在 进行 图 像 的 几何 变换 时 ， 除 了 要 进 
行 几何 变 换 运 算 之 外 ， 还 需要 进行 灰 度 级 插值 处 理 。 和 常用 的 灰 度 级 插值 方法 有 3 种 : 最 近邻 
插值 法 、 双 线性 插值 法 和 三 次 内 插值 法 。 

G>) 最 近邻 插值 法 

最 近邻 插值 法 是 一 种 简单 的 插值 方法 ， 如 
图 2-8 所 示 ， 它 是 通过 计算 与 点 Po y) 邻近 
的 四 个 点 ， 并 将 与 点 POS, yo) 最 近 的 整数 坐标 


点 Qo y) 的 灰 度 值 取 为 PQs yy) 点 灰 度 近 似 | e| Jem 























值 。 在 Plx, yo) 点 各 相 邻 像素 间 灰 度 变 化 较 小 rmm 
时 ， 这 种 方法 是 一 种 简单 快速 的 方法 ， 但 当 LI IN 
P(x,, ys) 点 相 邻 像素 间 灰 度 值 差异 很 大 时 ， 这 出 | BE 
种 灰 度 估计 值 方法 会 产生 较 大 的 误差 ， 甚 至 可 
能 影 响 网 像 质 量 。 

最 邻近 插值 算法 的 MATLAB 实现 源 程 序 2-8 最 邻近 插值 法 的 示意 区 


如 例 程 2-7 所 示 ， 图 2-9 是 例 程 2-7 的 运行 
结果 。 
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例 程 2-7 
K KK K KK K K K K K K K K K K K K K K K K K K K K K K K K K FK K K K K FK K FK K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK K FK K K K K 3K K K K 
I=imread('hua7.jpg'); 
I-rgb2gray(I); 
[r,c |-size(T); 


for 1=1:r 





for J=1:c 
B(1,2*])-1(1,j); 
B(1,2*5-1)-1(1]); 
end 
end 


for 1=1:r 
for jJ-1:2*c 
C(2*1,)-B(1,]); 
C(2*1-1,])-B(1]); 
end 
end 
subplot(121);imshow(D;title( 5s 4&5 KA; 
subplot(122):;imshow(C):title(' 最 邻近 插值 后 的 图 像 "); 


DULERLLLLLLLLLLLLLLLLLLLLLDLLELLLLLLLLLLLLLLLELLLLLLLI 


原始 图 像 最 邻近 插值 后 的 图 像 





a) b) 
图 2-9 例 程 2-7 的 运行 结 
a) 输入 的 原始 图 像 b) 最 邻近 插值 后 的 图 像 
(2) 双 线 性 插值 法 
双 线 性 插值 法 是 对 最 邻近 插值 法 的 一 种 改进 ， 即 用 线性 内 插 方 法 ， 根 据点 PO. ys) 的 四 
个 相 邻 点 的 灰 度 值 ， 通 过 两 次 插值 计算 出 灰 度 值 fO y,) ， 如 图 2-10 ITR. 

具体 计算 情况 如 下 : 

D 计算 a 和 pp 





ea 
P=y0-y 
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2) 驳 根 据 f(x,y) S+ y) AMER foy) 
f Q.y)-7 f(x, y)* abf GL y)- f Go y)] 
3) 再 根据 f(xo,y+1)， fQxLy) IER fx, y 1) 


[Gg y *D- x,y+D+oalf (x+l,y+1)-— fx, y+1)] 


4) 最 后 根据 f Gy. y) & foy. y +1) 插值 求 f (xo, yo) 


f (9: Yo) = f Gg. Y) + PL G5. y +1) - (xo,y)] 
-(I-ay1- B)f (x, y) - a(1 - B)f x Ly) 
-apf (x,y -1) - Baf(x-Lly-l) 


= f(x,y) + alf Œ +1,y)- Fx, V+ PL x, y+D)— f(x, y)]+ 
palf &œ+l,y+1)+ f(x, y)- f(x,y+l)— fix Ly) 

式 中 ，x=[x0]; y=[y0]。 

由 于 双 线 性 插值 法 已 经 考虑 了 点 P(xs, yy) 的 直接 邻 点 对 它 的 影响 ， 因 此 一 般 可 以 得 到 令 
人 满意 的 插值 效果 。 但 这 种 方法 具有 低 通 泪 波 性 质 〈 图 像 滤波 将 在 本 书 2.4 BNA), RW 
量 会 受到 损失 ， 使 岁 像 因 细节 退化 而 变 得 轮廓 模糊 。 在 茶 些 应 用 中 ， 双 线性 插值 糙 对 不 连 
续 还 可 能 会 产生 一 些 不 期 望 的 效果 。 

例 程 2-8 是 运用 双 线 性 插值 对 图 像 进行 放大 的 MATLAB 源 程序 ， 其 运行 过 程 如 图 2-11a 
所 示 ， 运 行 结果 如 图 2-11b 所 示 。 

例 程 2-8 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK K K K K FK K K K K K K K K FK FK FK FK FK FK FK K K K K K K FK 





图 2-10” 双 线性 插值 示意 图 


























function ImOut-myzoom(ImlIn,j) 

% 功能 : ”运用 双 线 性 插值 将 图 像 进 行 放大 
% 输入 :”ImIn- 竺 放大 的 灰 度 图 像 

% ARAF, KEREK X% 
% 输出 : ”ImOut- 放 大 后 的 图 像 


A-double(ImlIn); 
[a,b |-size( A); 


% TICK 2) f 
x—2^j; 
for t-0:x-1 
for k=1:a 
for I-1:b 
if t==x-1 
temp(k*x-t,l)-A(k,l); 
else 
temp(k*x-t,I)-0; 
end 
end 
end 














CEEE 


end 


% 列 放大 2 信 
for t-0:x-1 
for k=1:a*x 
for I-1:b 
if t-—2^-1 
ImOut(k,l*x-t)-temp(k,l); 
else 
ImOut(k,l*x-t)-0; 
end 





end 
end 
end 


% 对 行进 行 线性 插值 
for t-1:x-1 
for k-1:a-1 
for I-1:b*x 
ImOut(k*x-t71,I)2-ImOut(k*x-x- 1,1)--... 
(ImOut((k--1)*x-x-1,I)-ImOut(k*x-x-7-1,1))/x*(x-t); 
end 
end 
end 


% 对 列 进行 线性 插值 
for t-1:x-1 
for k-1:a*x 
for I-1:b-1 
ImOut(k,I*x-t-1)2ImOut(k,l*x-x-1)--... 
(ImOut(k,(1--1)*x-x-1)-ImOut(k,l*x-x4-1))/x*(x-t); 
end 
end 
end 


return 
KOK K K K K K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 


Command Window 
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E mí E M ND sens [saec data to stot — 7 





>> clear 

>> I-imread( hua8. jpg ): | Min | Max | 
>> I=rgb2gray (I); a I <460x360 uint8? 3 255 j 
>> imshow(I),title( ERAR ) : -| Imout <1920x1440 double? <Too... «Too... 
>> ImOut-myzoomíl, 2) : 

>> figure 

>> imshow(uint8 (InOut)), title C WEARER ) : 





a) 
图 2-11 运用 双 线 性 插值 放大 图 像 


a) 例 程 2-8 的 运行 过 程 
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» Figure 2 
File Edit View Insert Tools Desktop Window Help 


Figure 1 


File Edit View Insert Tools Desktop Window Help YM 


"nagH5|NÍiRAOSSOZ-[a 7 





2-11 运用 双 线 性 插值 放大 图 像 〈 续 ) 
b) 例 程 2-8 的 原始 图 像 及 其 运行 结果 
(3) 三 次 内 插值 法 
为 了 得 到 更 精确 的 PO, yy) 点 的 灰 度 值 ， 在 更 高 程度 上 保证 几何 变换 后 的 图 像 质 量 ， 实 
现 更 精确 的 灰 度 插值 效果 ， 可 采用 三 次 内 插值 法 等 更 高 阶 插值 法 ， 如 三 次 样 条 函数 、 
Legendre PORZ sin(rx) /(nx) 函数 等 ， 这 时 既 要 考虑 Ps. yu) 点 的 直接 邻 点 对 它 的 影 
啊 ， 还 应 考虑 该 点 周围 16 个 邻 点 的 灰 度 值 对 它 的 影响 〈 见 图 2-12 )。 


o x 
eger a 














i*1.7;-1 
(i+1,J 外 


(i42, J DA 





图 2-12 三 次 内 插值 法 的 示意 图 
根据 连续 信号 采样 定理 可 知 ， 硅 对 采样 值 用 插值 函数 s(x) = sin(nx) (nx) 进行 插值 ， 当 采 


样 频率 不 低 于 信号 频谱 最 高 频率 的 2 倍 时 可 以 准确 地 恢复 原 信 号 ， 并 可 准确 地 得 到 采样 点 间 
任意 点 的 值 。 
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s(x) = sin(nx) /(nx) 可 以 采用 以 下 三 次 多 项 式 近 似 。 


j= «p x|>1 
s(x)= 4-8|x|-- Sp - xp 2>|x|>1 > 
0 x| > 2 











采用 插值 函数 sin(nx) /(nx) , PJA FIR REAR fO. Yo) o 
D HE s(l+a), s(a). s-a), s(2-a) UR sQ0- B). s(B). s— B). s(2— p). 
2) 根据 f(x-Ly). fy) f(x+l,y)， f(x+2,y) 人 计算 f(x0,y)。 
fœ y)-2 slc a)f(x-Ly)*s(a)f Go y) +tsd-a)f(x+1,y)+ 
s(2 — a)f (x2, y) 
3) 按 步 骤 2) 求 foy Do fGuy*Do fGyy*2)- 
4) 根据 fy Do fO. y)» fO y *D» fog.y 2 WS fos.) 。 
f 0. yy) =s + B)f Gu. y - D +SS Co y) tsa- B)f Oy, y c D + 
s(2— P) Gs. y * 2) 
上 式 计 算 过 程 可 用 和 矩阵 表示 为 
A=(s(l+a) sla) s-a) s(2—2o)) 





fix-Ly-D fx-l,y) f(x-l,y+l) f(x-Ly-2) 
(| fGy-D DD) Jo7+D  f&,y+2) 

f(x+1,y-D f(x+l,y) f(x-*Ly-lD f(x-Ly-2) 

f(x+2,y-D f(x+2,y) f(x+2,y+1) f(x+l1,y+2) 


C=(s(1+8) s(B) s(1- B) sQ-) 
ft MATLAB 数字 图 像 处 理工 具 箱 提供 了 imresize 函数 ， 采 用 不 同 的 插值 方法 可 改变 图 
像 的 大 小 ， 其 调用 格式 如 下 。 
B = imresize(...,method,h) 
imresize 因数 使 用 由 参数 method. 指定 的 插值 运算 来 改变 图 像 的 大 小 。method 的 几 种 可 
选 值 为 : 
"nearest'( 默 认 值 ) 最 近邻 插值 ; 


bilinear 双 线性 插值 ; 
bicubic' 双 三 次 插值 。 
例 程 2-9 是 调用 imrersize 函数 进行 图 像 放 缩 的 MATLAB 程序 ， 其 运行 结果 如 图 2-13 
所 示 。 
例 程 2-9 


KK K K K K K K K K K K K K K K ÞK K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K FK K K K K K K ÞK K K FK FK FK FK FK FK K K K 2K K K K 





I=imread('hua9.jpg'); 
I-rgb2gray(l); 
% 采 用 最 临近 插值 法 进行 灰 度 插值 ; 











MATLAB 数字 图 像 处 理 实战 


X l=imresize(1,1); 

% 采 用 双 线 性 插值 法 进行 灰 度 插值 ; 
X2=Imreslze([1,bllinear ); 

% 采 用 三 次 内 插 法 进行 灰 度 插值 ; 
X3=1mresize(l,1,'bicubic'); 
subplot(221),imshow(L[ ]),title( i 46 KAN; 
subplot(222),imshow(Xl,title(' 最 邻近 插值 法 ); 
subplot(223),imshow(X2),title( 双 线性 插值 法 "); 
subplot(224),imshow(X3),title(' 三 次 内 插 法 '); 
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双 线 性 插值 法 


NUS 





K| 2-13 WFE 2-9 的 运行 效果 


2.1.3 攻 像 的 邻 域 操 作 


邻 域 操作 是 指 将 每 个 输入 的 像素 值 及 其 东 个 邻 域 的 像素 值 结 合 处 理 而 得 到 对 应 的 输出 像 
素 值 的 过 程 。 邻 域 通 各 形状 规 则 。 

请 动 邻 域 操 作 一 次 处 理 一 个 像素 。 请 动 邻 域 操 作 的 步骤 如 下 。 

1) 选择 一 个 单独 的 像 聚 。 

2) 确定 该 像素 的 滑动 邻 域 。 

3) 对 邻 域 中 的 像素 值 应 用 一 个 函数 求 值 ， 该 函数 将 返回 标量 计算 结果 。 

4) 将 计算 结果 作为 输出 图 像 中 对 应 的 像素 的 值 。 

5) 对 输入 网 像 的 每 个 像素 都 重复 以 上 步骤 。 

邻 域 操 作 的 方法 充分 地 利用 了 图 像 相 邻 像 又 间 的 磊 色 关系 ， 利 用 相 邻 像 又 则 的 闫 色 分 布 
对 图 像 进行 平滑 、 增 强 、 边 缘 提 取 、 滤 波 、 恢 复 等 操作 。 
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例 程 2-10 是 进行 邻 域 操 作 的 MATLAB 源 程 序 ， 其 运行 结果 如 图 2-14 所 示 。 
例 程 2-10 


KKK K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK K FK K K K K 3K K K K —9SA 
% 读 入 图 像 >) 
I=imread('hua10.jpg'); best 
% 将 彩色 图 像 园 换 成 灰 度 图 像 ; ~ 
I-rgb2gray(l); 
% 求 灰 度 图 像 的 行 、 列 数 ; 
[m,n]-size(I); 
% 生成 滑 块 模版 
C=[-1 -1 -1 

-18-1 

= =| 
% 转换 成 双 精 度 型 以 进行 矩阵 运算 ; 
I-double(I); 
% XEATIB ERSTE: 


for 17-2:m-1 





for j-2:n-1 
L-I(i-1:i-1,j-1:j*-1).*C; 
A(1,j))»sum(sum(L)); 
end 
end 
% 显示 图 像 ; 
subplot(121),imshow(uint8(T)),title( Ji 4 E] f£); 
subplot(122),imshow(uint8(A)),title( 滑 动 邻 域 操作 后 的 图 像 "): 
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原始 图 像 滑动 邻 域 操作 后 的 图 像 





图 2-14 例 程 2-10 的 运行 结果 
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下 面 结合 例 程 2-10 讲解 邻 域 操 作 的 过 程 。 在 运行 例 程 2-10 之 后 ， 和 矩阵 C 在 图 像 上 滑动 
的 时 候 ， 首 先 要 修改 原始 图 像 的 (2,2) 元 素 ， 修 改 方法 如 下 : 

1) 使 用 滑 块 和 矩阵 C 与 以 原 图 像 的 (2,2) 为 中 心 的 3x3 邻 域 矩阵 对 应 元 素 相 乘 ， 得 到 了 新 
的 3x3 FERE Lo 

2) EERE L 的 所 有 元 素 相 加 ， 其 和 作为 新 图 像 的 (2.2) 元 素 值 。 如 此 下 去 ， 最 后 第 一 
行 、 第 一 列 和 最 后 一 行 、 最 后 一 列 的 元 素 没有 修改 。 











编程 点 睛 : 在 对 图 像 进行 邻 域 操作 编程 时 ， 主 要 是 利用 多 重 循环 语句 来 实现 。 例 
如 ， 在 四 重 循环 中 ， 外 面 两 重 是 对 滑 块 进行 操作 ， 让 消 块 逐 行 逐 列 滑动 ; 里 面 两 重 循环 


主要 是 对 邻 域 内 的 图 像 灰 度 值 进 行 操作 。 在 例 程 2-10 中 ， 里 面 两 重 循环 用 语句 *L-Ii- 
1: 计 1j-1j 寺 1D.*C” 来 实现 了 ， 该 语句 中 短 阵 乘法 是 两 个 大 小 一 样 的 天 阵 对 应 元 素 相 乘 。 





经 验 分 享 : 如 何 提高 二 维 双 线 性 灰 度 插值 的 实时 性 

如 何 提高 算法 的 实时 性 是 数字 图 像 处 理 领 域 研究 的 热点 。 对 于 二 维 双 线性 灰 度 播 
值 ， 可 以 利用 二 维 双 线性 函数 的 可 分 离 性 ， 即 二 维 双 线性 函数 可 以 看 做 两 个 一 维 线性 
函数 的 来 积 ， 将 二 维 双 线性 灰 度 插值 算法 分 为 两 步 一 维 线性 插值 来 实现 : 先 沿 着 水 平 
方向 进行 一 维 线 性 插值 ， 再 没 着 垂直 方向 进行 一 维 线 性 插值 ， 从 而 达到 提高 其 运算 效 
率 的 目的 。 


2.2 图 像 的 傅 里 叶 变 
IPM (T 7. Ie 0E lSk 


什么 是 频率 ? 简 言 之 ， 频 率 就 是 信号 变化 的 快慢 。 在 频 域 中 ， 频 率 越 大 说 明 诛 始 信号 变 
化 速度 越 快 ， 频 率 越 小 说 明 诛 始 信号 越 平 组。 当 频 率 为 0 时 ， 表 示 直 流 信 号 ， 没 有 变化 。 高 
频 分 量 解析 信和 号 的 突变 部 分 ， 而 低频 分 量 次 定 信和 忆 的 整体 形象 。 

在 图 像 处 理 中 ， 频 域 反 映 了 图 像 在 空域 灰 度 变化 的 剧烈 程度 ， 也 束 是 图 像 灰 度 的 变化 速 
度 ， 即 图 像 的 梯度 大 小 。 对 图 像 而 言 ， 岁 像 的 边缘 部 分 是 突变 部 分 ， 变 化 较 快 ， 因 此 反映 在 
频 域 上 是 高 频 分 量 ;， 网 像 的 噪声 大 部 分 情况 下 是 高 频 部 分 ;图像 平缓 变化 部 分 则 为 低频 分 
量 。 图 像 的 频 域 处 理 是 指 根据 一 定 的 图 像 模 型 ， 对 图 像 频谱 进行 不 同 程度 的 变换 。 图 像 的 傅 
里 叶 变 换 就 是 第 用 的 图 像 频 域 分 析 方 法 。 


2.2.2 解析 离散 传 里 时 变换 


离散 傅 里 时 变换 (Discrete Fourier Transform, DFT) 是 岁 像 处 理 最 为 第 用 的 一 个 变换 手 
段 。 利 用 傅 里 时 变换 ， 把 图 像 的 信号 从 空域 转 到 频 域 ， 使 得 信号 处 理 中 第 用 的 频 域 处 理 技术 
应 用 到 图 像 处 理 上 ， 这 无 疑 大 大 拓展 了 图 像 处 理 的 思想 和 方法 。 

这 些 数学 性 质 在 物理 实现 上 有 重要 的 应 用 价值 ， 并 且 有 快速 算法 ， 这 些 算法 可 固化 在 右 
件 上 ， 也 可 以 通过 区 学 右 件 实现 。 傅 里 时 变换 在 图 像 滤 波 、 噪 声 滤 波 、 选 择 性 滤波 、 压 纵 和 


















































X25 CES EX 





iom) ZMH o 
假设 了 (m,n)(m=0,1,…,M -En20,---, N -D i M x N 图 像 EE HEPTIDUS E aE 
换 的 定义 如 下 。 








M-1N-1 2n mk nl 
FED- S Y fiae N) D 
m=0 n=0 
其 反 变 换 为 : 
M-1N-1 j (Em) 
f (m,n) = FlklDe ~“? 
k=0 1=0 








Xu e Pr gg el ers N ry ppt te RU a m 和 n 为 空间 域 采 样 值 ; 大 
和 1 为 频率 采样 值 ，F(wu,v) 称 为 离散 信号 f oo y) 的 频谱 。 

傅 里 叶 变换 提供 另外 一 个 角度 来 观察 图 像 ， 可 以 将 图 像 从 灰 度 分 布 转化 到 频率 分 布 上 来 
观察 图 像 的 特征 。 傅 里 叶 变 换 可 以 被 看 做 是 数学 上 的 棱镜 ， 将 函数 或 图 像 基于 频率 分 解 为 不 
同 的 成 分 。 同 样 ， 傅 里 叶 变 换 能 通过 频率 成 分 来 分 析 一 个 函数 或 图 像 。 


2.2.3 例 程 精 讲 


根据 二 维 离散 傅 里 时 变换 的 定义 ， 图 像 的 离散 傅 里 叶 变换 可 由 例 程 2-11 的 MATLAB 代 
EKI. 
例 程 2-11 
% 读 入 RGB 图 像 
A-imread('pic2.2.1.jpg"); 
% 将 RGB 图 像 转 化 成 灰 度 图 像 
B-rgb2gray(A); 
% unit8 型 转化 为 双 精 度 double 型 
B-double(B); 




















s-size(B); 
M=s(1);N=s(2); 
% 根 据 (2.2.1) 计算 输入 图 像 的 离散 傅 里 叶 变换 
for u-0:M-1 
for v-0:N-1 
k=0; 
for x-0:M-1 
for y-0:N-1 
k-B(x-*1,y71)*exp(7j *2*pi*(u*x/M-v*y/N))*k; 
end 
end 
F(u+1,v+1)=k; 


end 








f MATLAB santez 


end 
% 显示 变换 结 朱 
subplot(121),imshow(uint8(B)),title(' 原 始 图 像 ); 
subplot(122),imshow(F),title(' 傅 里 叶 频 谱 "); 
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例 程 2-11 的 运行 结果 如 图 2-15 PTR. 






原始 图 像 传 里 叶 频 谱 
AS aA d perg ions uo a ma A 
EREC + : M 





图 2-15 例 程 2-11 运行 结果 


在 MATLAB 中 可 直接 调用 图 像 处 理工 具 箱 中 的 M2 函数 实现 二 维 图 像 的 快速 傅 里 叶 变 换 : 
Y = f(X) 


输入 : 二 维 灰 度 图 像 数组 X. 
输出 : 傅 里 叶 变 换 结果 了 7。 
例 程 2-12 是 调用 ffo 函数 进行 二 维 图 像 侍 里 叶 变 换 有 的 例子 ， 其 运行 结 末 如 图 2-16 
PIER 
例 程 2-12 
K KK K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K FK K K FK K FK K FK FK K 3K K FK FK K FK K FK K K K K 3K K K K 
N=100 
f=zeros(50,50); 
f(15:35,23:28)=1; 
subplot(121),imshow(f),title( 4 [H] Js Ee] ff"); 
F-ffO(f,N,N); 
F2-fftshift(abs(F)); 
subplot( 122); 
x=1:N;y=1:N; 
mesh(x,y,F2(x,y));colorbar,title( f£ Œ nt A iE; 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK ÞK K FK FK K K FK K K K K K K 2K K 


MEM 高 效仿 里 时 变换 的 性 质 


设 阵 列 [f (m,n)]yxw €» [F(K, DT) |ui ? [g(m,n) |y €» [G(K,1) |ui d 则 其 具有 以 下 性 质 。 
(10. 延 拓 周期 性 








f (m,n) 2 f (m+aM,n+bN) 
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伟 里 叶 变 换 幅 值 
空间 域 图 像 uk 


e 





图 2-16 FEJE R RES BC ECTS Hur SE RU fH. 





F(k,l) » F(k aM l4 bN) 


AUB, m,k-20,---,M-bhnil20,L.--, N-ha,b 为 整数 。 这 是 因为 e Py mon 
k l 的 周期 函数 ， 周 期 分 别 为 WM MN 。 

(2) 可 分 性 

变换 是 可 分 的 ， 即 


2j. zr) £j2s tji 
— € ids 


这 个 性 质 可 使 二 维 离散 傅 里 叶 变 换 依 次 用 两 次 一 维 变 换 来 实现 。 
(3) 线性 
离散 傅 里 时 变换 和 反 变 换 都 是 线性 变换 ， 即 
Flaf (m,n) * bg(m,n)] = aF| f (m,n)] - bF[g(m,n)] 
F '[eF(k,l) + BG(k,D]- oF 7[F(k,D]+ BF [G(k,1)] 
(40 尺度 缩放 性 


f (am, bn) < —— = F(- 一 上 ,一 /) 


|ab| 
特别 地 ， 当 ap= -1 时 ， 有 : 
f(—m,—n) < F(-k,-1) 
即 离散 傅 里 叶 变 换 具 有 符号 改变 对 应 性 。 
(5) 平移 性 质 








mk nl 
M` v 


f (n — my,n — ny) < F(k,l)e a 
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Tal me 
2d 


F(k-k,,l-1,) & f(m, n! 


UB. m,m 分 别 表示 横 纵 方向 的 平移 量 。 
对 图 像 进行 平移 傅 里 叶 变换 和 不 平移 侍 里 叶 变 换 的 效果 如 图 2-17 所 示 。 





图 2-17 对 图 像 进行 平移 传 里 叶 变 换 和 不 平移 傅 里 叶 变 换 
a) 原始 图 像 bo) 直接 进行 傅 里 叶 变 换 c) 平移 后 进行 的 传 里 叶 变换 


在 阵列 阵 元 有 限 的 概念 下 ， 这 种 位 移 是 循环 位 移 。 循 环 位 移 相 当 于 原 阵 列 周期 延 拓 后 的 普 
通 位 移 。 这 个 性 质 表 明 ， 一 个 阵列 发 生平 移 ， 它 的 傅 里 时 变换 阵列 只 改变 相位 ， 而 幅 值 不 变 。 
C6) 旋转 性 质 
在 连续 傅 里 叶 变 换 中 有 
f(r,O* 0) & F(p.9 t &) 
AF, 0, 表示 对 应 的 旋转 角 大 小 。 
将 图 像 进行 旋转 后 的 傅 里 时 变换 如 网 2-18 所 示 。 





图 2-18 将 图 像 进行 旋转 后 的 侍 里 时 变换 


A, (m,n)= f (m,n)- f(m-1,n) 
A, f (m,n) — f im,n) — f (m,n -1) 
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则 
^. f(m,n) & Fen WE amir) 


A, f(m,n) & FD ug iy | © 


Hr RTEMRRIAH, ET RE A EREITEN RA ION BRET rOB JEUX 
(8) 和 分 











f m,n) - f(m-l1,n) € Fæ DU e "v | 


f(m,n)- f(m,n-1) e FD be dd 
此 性 质 表 明 ， 在 空间 域 中 对 图 像 像素 作 和 相当 于 对 图 像 信 号 进行 低 通 波涛 。 
(9) 卷 积 
两 幅 图 像 的 卷 积 等 于 其 傅 里 时 变换 的 乘积 ， 即 
f (m,n)* (m,n) F(k,l)G(k,l) 











f(m,n)g(m,n) e y FO) * G(K,I) 


Jer, f(m,n)* gmn 2 3, S f. De (m - n- j) - 


ico. 25 
(100. 图像 的 快速 傅 里 叶 变 换 
快速 伟 里 叶 变 换 (Fast Fourier Transform, FFT)〉 的 主要 思想 是 将 原水 数 分 为 奇数 项 和 侦 





数 项 ， 通 过 不 断 将 一 个 奇数 项 和 一 个 个 数 项 相 加 ( 减 )， 得 到 需要 的 结 末 。 也 厌 是 说 ，FFT 














入 复 森 的 乘法 运算 变 成 两 个 数 相 加 减 ) 的 便 单 重复 运算 ， 即 通过 计算 两 个 单 点 的 DFT 


来 计算 一 个 双 点 的 DFT; 通过 计算 两 个 双 点 的 DFT， 来 计算 四 个 点 的 DFT… 依 此 类 推 。 


设 离散 函数 f(m,n) 在 有 限 区 域 COzmzM-LOznzN-1)0 JE, MRE But a 


换 的 主要 推导 过 程 如 下 。 


^ 


则 有 


1| 2 c 2p 2 3 p(2m+1) 
—-—|—» f(2mW,"-—5 f(2m+1W p" 
2 N n=0 M N n=0 M 


1| 1v om 18 2pm 
-l 1i Vy romy2" +L Y fom pw me 
HES N > N N 


- ZIF, (p)+ Wy F.Cp)] 
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同 理 
F(p+M)=35IR(p+M)+ WE F, (p+M)] 
= JIE (p) + We" FG] 
又 因为 
yp," ww =W} ew |- j m) - W? exp(- jn) =W? 
所 以 


F(p- M) = F, () -WE F(p) 
由 上 述 推导 ， 可 得 FFT 的 定义 式 为 : 


n B 
m jaan p-041.,M-1 

F Mà. M? e IN 

(p,q) = > ) q=0,1,;-,N -1 








Has ARR: 
pm jam qn m=0,1,.…,M —1 


fn, 5) ug ZFC ge se 1-01. N-1 


p=0 q=0 


二 维 传 里 叶 变 换 的 应 用 : 相位 相关 





相关 〈correlation)， 顾 名 思 义 ， 驳 是 两 个 事物 的 相关 性 。 在 信号 处 理 中 ， 两 个 信号 的 郑 
积 束 是 相关 ， 可 以 用 于 表征 两 个 信号 的 相似 程度 。 

关于 图 像 的 相位 ， 我 们 知道 ， 图 像 的 频率 域 〈 傅 里 叶 频 谐 ) 包含 了 模 (amplitude〉 和 相 
位 〈phase) 信息 ， 模 包含 图 像 整 体 的 灰 度 级 信息 ， 而 相位 信息 包含 了 图 像 变 化 的 信息 。 可 
以 说 ， 相 位 是 图 像 的 DNA， 不 同 图 像 ， 模 有 可 能 是 相同 的 ， 但 相位 却 是 不 同 的 。 利 用 这 一 
点 ， 求 取 相 位 的 相关 ， 束 可 以 知道 图 像 之 则 的 差别 。 

由 于 相关 是 通过 卷 积 进 行 计 算 的 ， 计 算 量 大 ， 所 以 ， 一 般 都 先 通 过 传 里 时 频谱 的 内 积 ， 
然后 再 做 一 次 傅 里 叶 逆 变换 就 可 以 求 取 相 位 相关 。 

相位 相关 用 于 估计 图 像 的 偏 移 量 是 由 C.D. Kuglin 和 D.C.Hines 在 1975 年 提出 的 。 

设 图 像 有 (x,y) 为 图 像 f(x,y) 分 别 沿 x EUR y 轴 平 移 xo 和 yo 后 得 到 的 图 像 ， 即 : 


f(x,y)= fic XY- yo) 
则 它们 的 傅 里 叶 变 换 满 足下 列 关 系 : 
F (én) eg e x Fi(E,N) 
图 像 f(x,y) IL f Gc, y) 的 互 功 率 谱 定 义 为 : 





























FS, nr, (o. n) _ eJ 27» +77]0 ) 一 
CE n= A aN (2-13) 
FREMDE E| 


AP, FUN OFOWIEMu X 213) 表示 两 图 像 f(x,y) 和 (x,y) AMES EDR 
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相位 相等 。 对 式 (27130. 进行 傅 里 叶 反 变换 ， 则 有 : 
c(x, y) 2 ó(x — xo, y — Yo) 

式 中 ，c(x,y) 是 位 于 09, yo) 的 神 击 函 数 ， 可 求 得 两 图 像 间 的 平移 量 xo 和 yoo 

如 果 两 幅 图 像 是 一 臻 的 (完全 相同 )， 那 么 它们 的 相位 相关 就 是 一 个 脉冲 函数 ， 脉 冲 位 © 
置 在 坐标 原点 ， 高 度 为 le 

如 果 两 幅 图 像 不 一 致 ， 那 么 ， 在 相位 相关 的 矩阵 里 ， 最 高 的 那个 脉冲 坐标 就 是 两 幅 图 像 
的 位 置 偏 移 量 ， 而 脉冲 的 高 度 也 会 小 于 1。 

利用 相位 相关 求 两 幅 图 像 偏 移 量 的 MATLAB 源 程序 如 例 程 2-13 所 示 ， 其 运行 结果 
如 图 2-19 所 示 。 

例 程 2-13 


DLELLLLELLLLLLLLLLLLLLLELLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLEIE 






































clear all; 

9o IAR, JPTEELSSSTUL HH NODURS REB, ELS SEXETTAR PES TE ; 
I1= imread('hilll.jpg^; 

I2- imread('hill2.]pg^; 

% 输入 两 幅 图 像 的 尺寸 大 小 应 该 相同 ; 
Ia = double(11); 

Ib = double(I2); 

Iin = Ib; 

[m,n]=size(lin); 

% 添加 随机 噪声 ; 

Ia = Ia + 20*randn(m,n); 

Ib = Ib + 20*randn(m,n); 





% 添加 Hamming 窗 ， 以 提高 信 噪 比 ; 
window = hamming(m)*hamming(n)'; 


% HEITER Hp ARTS; 
A = fft2(Ia.* window); 
B = fft2(Ib.*window); 


% 计算 归 一 化 互 功 率 谱 ; 
S = B.*conj(A) ./ abs(B.*conj(A)); 


vo 转换 到 空间 域 ; 
s = abs(ifft2(S)); 





9o AREA BUB EE 
M = max(max(s)); 
[1j] = find(s == M); 


% 计算 信 噪 比 ; 


avg = mean(mean(s.*s)); 
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snr = 10*logl0(M*M /avg); 


% 计算 网 像 的 俩 移 量 
x sh = floor(m/2)-i; 
y sh- floor(n/2)-j; 


disp(['Estimated translation: (' num2str(x sh) ',' num2str(y sh) ) pixels; with SNR ' num2str(snr) 'dB' | ); 
colormap('gray); 

figure(1); 

subplot(1,3,1);imshow(I1); title Elf A^; 

subplot(1,3,2);imshow(12); title Él ffs BY; 

subplot(1,3,3);mesh(512*s); title(' 相 位 相关 运算 过 程 ); 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK K K FK FK FK K FK K K K K K K K K 
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输入 图 像 A 输入 图 像 B 


相位 相关 计算 过 程 


图 2-19 WFE 2-13 的 运行 及 其 结果 
相位 相关 主要 用 于 图 像 配 准 (image registration)， 由 于 相位 信号 避免 了 图 像 中 低频 噪音 




















的 影响 ， 在 光照 条 件 变化 的 应 用 环境 表现 突出 ， 被 广泛 应 用 于 遥感 、 医 学 图 像 等 领域 。 
WE 


经 验 分 享 : 如 何 理 解 图 像 的 传 里 时 变换 

从 纯粹 的 数学 意义 上 看 ， 侍 里 叶 变 换 是 将 一 个 函数 转换 为 一 系列 周期 函数 来 处 理 的 
过 程 。 

从 物理 效果 上 看 ， 傅 里 叶 变 换 是 将 图 像 从 空间 域 转换 到 频率 域 ， 其 逆 变 换 是 将 图 
像 从 频率 域 转换 到 空间 域 。 换 多 话说 ， 傅 里 叶 变 换 的 物理 意义 就 是 将 图 像 的 灰 度 分 布 
SE 0 数 ， 傅 里 叶 逆 变换 是 将 图 像 的 频率 分 布 函 数 变换 为 灰 度 


T 是 表征 图 像 中 灰 度 变化 剧烈 程度 的 指标 ， 是 灰 度 在 平面 空间 上 的 梯度 
例如 ， 大 面积 的 沙漠 在 图 像 中 是 一 片 灰 度 变 化 缓慢 的 区 域 ， 对 应 的 频率 值 很 低 ; 而 对 于 
E Lag 32 ZRDUEX, CAER P XE AUR SEACUBL ALS DU, 6p BL 3E 
较 高 。 


因此 ， 将 一 幅 图 像 进行 倩 里 叶 变 换 后 ， 就 将 图 像 中 的 高 频 信 息 和 低频 信息 在 频率 域 
分 开 了 ， 方 便 对 图 像 进 行 各 种 处 理 ， 如 进行 图 像 平 滑 、 边 缘 提 取 等 操作 。 
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2.3 图像 的 余弦 变 


从 本 书 2.2 市 图 像 伟 里 叶 变 换 的 内 容 可 以 看 到 ， 傅 里 叶 变 换 是 用 无 穷 区 间 上 的 复 正 强 基 D 
EK RAE cs EE A RRR S P AEKA, Bo EHA S A EARE EAE RAR S8 E 
影 。 傅 里 时 变换 存在 一 个 最 大 的 问题 吏 是 它 的 参数 都 是 复数 ， 在 数据 的 描述 上 相当 于 实数 的 
两 倍 。 为 了 解决 这 一 问题 ， 科 研 工 作者 布 望 找到 一 种 能 够 实现 相同 功能 但 数据 量 又 不 大 的 变 
换 方 法 。 
实际 上 ， 基 范 数 可 以 有 其 他 不 同类 型 ， 相 当 于 用 不 同类 型 其 函数 去 分 解 信号 图像 )。 
余弦 变换 是 其 中 币 用 的 一 种 ， 它 在 图 像 压缩 中 具有 广泛 的 应 用 。 


"KNEE 从 DFT 到 DCT 












































事实 上， 离散 余弦 变换 (DCT) 是 从 离散 傅 里 叶 变 换 (DFT) 发 展 过 来 的 。 我 们 知道 ， 
铝 周期 函数 是 实 的 个 函数 ， 那 么 它 的 傅 里 叶 变 换 中 将 上 只 含 余弦 项 ， 这 对 离散 的 情况 也 是 
适用 的 。 

Z fQ)(i=0,1,…,N 一]) 为 一 给 定 的 序列 ， 按 下 式 将 其 延 拓 成 偶 对 称 序列 : 
fü  i-0L-,N-1 
fii-D is-hes-N 





so- 





Si =i+1/2, IFZ f. ( )= f. i-1/2) 以 i =0 为 对 称 中 心 ， 对 其 做 离散 傅 里 叶 变 换 : 
l S mam P 
E k = J 1 
n ) DN per (i je 


N-1 
- 23. (i)cos[Qi + Dkn/2N],k 2 —N,--.,0,-., N -1 
i=0 





式 中 ， F (1) 表示 对 应 的 傅 里 叶 变 换 。 
由 DFT 的 性 质 可 知 ， 瓦 (6 是 对 称 序列 ， 取 其 一 半 作 为 序列 人 (GD 的 一 半 SONAR 
JB YR, TIS. 


F (k)= BYN (i)cos[(2i+ Dkr/2N],k =0,--,N —1 
对 变换 核 归 一 化 后 的 结果 如 下 。 
g(i,k)= ao cos[(2i + D kn / 2N ] 


1 
E k 20 
A(k) 24 V2 
[| kele Nel 


其 天 量 形式 为 : 
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其 中 : 
d. ER u d 
V2 42 42 
2 COS EUR COS Eu ees COS E - Dn 
Cor IB 2N 2N 2N 
(N-n 3(N — Dx (2N —D(N -Dr 
COS 2N N COS ->N — N COS  —23N N 


AREE C, 显然 是 正 交 和 矩阵 ， 据 此 很 容易 写 出 其 逆 变 换 为 : 
fC al Caut 
其 二 维 DCT 形式 是 一 维 DCT 的 扩展 。 对 二 维 DFT， 可 以 首先 对 行进 行 一 维 变 换 然 
后 再 对 列 进 行 一 维 变换 ， 这 同样 适用 于 二 维 DCT。 据 此 可 以 写 出 二 维 DCT 变换 的 表 


达 式 : 
FOD=—2 V V AW AC) cosIQi DER/ 2M Teos[Q j  DIx/2N] 
MN kæ 120 
d. k=0 
A(k) 24 V2 
l k=1,.……,M —1 
l 
d. des) 
AD 25 V2 
l l=1,-,N -1 
写成 矩阵 的 形式 为 : 
[F] = Cy.ulf IC y (2-14) 
HRN : 
[f]= Cul Cy. 
其 中 ， 
1/V2 1/ V2 . 1/42 
cos(n/ 2M) cos(3x / 2M) cos((2M —1)n/2M) 
Cuxu = a cos(2x/ 2M) cos(61/ 2M) " cos((2M -1)2x/2M) 
cos((M —1)1/2M) cos(3(M —-1)x/2M) .. cos((2M —1)(M -ID)n/2M) 
1/ M2 1/V2 " 1/ M2 
cos(1/ 2N) cos(3n/ 2N) " cos((2N —1)n/2N) 
Cy = I" cos(2x / 2N) cos(6x./ 2N) " cos((2N —1)2n/2N) 


cos((N -1)x/2N) cosQ(N —1)x/2N) .. cos((2N —-D(N - D)x/2N) 








ct25 CEEE 





2.3.2 人 例 程 精 讲 | 
例 程 2-14 是 根据 正 交 变换 可 分 离 性 编写 的 二 维 离散 余弦 变换 的 MATLAB 实现 程序 ， 其 
核心 思想 是 先 对 图 像 矩 阵 的 行进 行 一 次 一 维 余弦 变换 ， 再 对 变换 后 的 矩阵 的 列 进 行 一 次 一 维 di 











余弦 变换 。 
例 程 2-14 
KOK K K K K KKK K K K K K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 
function y=rdct2(x,n,m) 
% 功能 : 实现 二 维 离散 余弦 变换 
Vo 输入 : x- 待 变换 的 灰 度 网 像 
% mn- 行 变换 的 区 域 大 小 ， 默 认 值 为 [mn]=size(x) 


[dimx,dimy] = size(x); 
if nargin-2 
n = dimx; 
m = dimy; 
end 
y — zeros(n,m); 
for ii-1:n 
y(11,:) = rdct(x(11,:),m); 


end 
for ii-1:m 

y(:,11) = rdct(y(:,11),n); 
end 


function y-rdct(x,n,a,b) 
% 实现 一 维 离散 余弦 变换 函数 
fl=size(x, 1 )==1; 
if fl x=x(:); end 
[m,k]-size(x); 
if nargin-2 n=m; 
end 
if nargin«4 b=1; 
if nargin«3 a-sqrt(2*n); 
end 
end 
if n>m x-[x; zeros(n-m,k)]; 
elseif nem x(n+1:m,:)=[]; 
end 


x=|x(1:2:n,:); x(2*fix(n/2):-2:2,:)]; 
z=[|sqrt(2) 2*exp((-0.51*pi/n)*(1:n-1))].*; 
y-real(fft(x).*z(:,ones(1,k)))/a; 
y(1,:)-y(1,:)*b; 
if fl y=y.'; end 
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KOK K K K K K KK K K K K K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 3K K 
例 程 2-15 EKME A BRIER ENF e 
例 程 2-15 

KOK K K K K K KK K K K K K K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K 3K K K K K K 3K K K K 

function y=irdct2(x,n,m) 

% 功能 :实现 二 维 离 散 首 余弦 变换 

% 输入 : x- 待 变换 的 图 像 

% m,n- 待 变换 的 区 域 大 小 ， 默 认 值 为 [m,n]=size(x) 





[dimx,dimy| = size(x); 
if nargin-2 
n = dimx; 
m = dimy; 
end 


y — zeros(n,m); 


for ii-1:n 

y(11,:) = irdct(x(11,:),m); 
end 
for ii-1:m 

y(:,11) = irdct(y(:,11),n); 
end 


function x-irdct(y,n,a,b) 

% 实现 一 维 离散 逆 余 弦 变 换 函 数 
fl=size(y, 1 )==1; 

if fl y=y(:); end 

[m,k |-size(y); 





if nargin«4 b-1; 
if nargin-3 a-sqrt(2*m); 
if nargin-2 n=m; 
end 
end 
end 
if n>m y=[y; zeros(n-m,k)]; 
elseif n«m y(n4*1:m,:)-|]; 
end 


x—zeros(n,k); 
w-ones( 1,k); 
m=fix((n+1)/2); 
p-n-m; 
Z—0.5*exp((0.51*pi/n)*(1:p)).*; 
u-(y(2:p-*1,:)-11*y(n:-1:m- 1,:)).*z(:,w)*a; 
y-[y(1,:)*sqrt(0.5)*a/b; u(1:m-1,:)]; 
if m--p 
z—-0.51*exp((1*pi/n)*(0:m-1)).'; 
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y-(C,w)*0.5).*(conj(flipud(u))-y)*y; 
z=ifft(y,[],1); 
u=real(z); 


y-imag(z); 
q-m/2; e» 
h-rem(m,2)/2; 
x(1:4:n,:)»u(1:q--h,:); i 
x(2:4:n,:)=y(m:-1 :q+1-h,:); 
x(3:4:n,:)=y(1 :q-h,:); 
x(4:4:n,:)=u(m:-1:q+1+h,:); 
else 
z=real(ifft([y; conj(flipud(u))]); 
x(1:2:n,)=z(1:m,:); 
x(2:2:n,:)=z(n:-1:m+1,:); 
end 


if fl x=x.'; end 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K K K K K K K K K K K K K K K K K K K K ÞK K K FK FK K K FK K K K K K K 2K K 





例 程 2-14 和 例 程 2-15 的 运行 过 程 如 图 2-20 所 示 ， 其 运行 结果 如 图 2-20 所 示 。 


Command Window 


>> I=imread{ picl. jpg}: 
>> I=rgb?gray (1): | Min 





>> y=rdct2 (I); I £353x411 uint? 0 255 
>> x-irdct?2(y): x 4353x411 double? T.21... 255 
>> subplot (1, 3, 1), imshow(I),title( FHAR ) y S353:1T11 double? 74.4... 5.83... 


>> subplot (1,3, 2),imshow(uint8(y)), title 二 维 你 撤 变 换 的 结果 ) 
>> subplot(1,3,3),imshow(uint8 (x)),title( 二 维 余 接 道 变换 的 结果 ) 


a) 
原始 图 像 二 维 余弦 变换 的 结 霖 二 维 余弦 逆 变 换 的 结 末 





b) 








图 2-20” 例 程 运行 过 程 及 结 


a) 例 程 2-14、2-15 的 运行 过 程 b) 例 程 2-14、2-15 的 运行 结 


在 MATLAB 中 ， 实 现 DCT 变换 的 函数 为 dct， 其 着 变换 的 函数 为 idct。 其 用 法 如 表 2-2 
FI. 


X 2-2 MATLAB 中 DCT 变换 常用 函数 表 


PR XE M 用 法 
y-det(x) 一 维 快速 DCT RK, XNE, R 了 为 等 大 小 的 同 量 


B-dct2(A) 二 维 快速 DCT 变换 ，4 为 一 和 矩阵， 结果 B 为 等 大 小 的 实 值 矩 阵 
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CBE) 
函数 名 称 用 法 
x-idct(y) 一 维 快速 逆 DCT 变换 ， 针 为 一 问 量 ， 结 果 了 为 等 大 小 的 癌 量 
B=idct2(A) 二 维 快速 逆 DCT 变换 ，4 IAEE, ER B IERSKE E 


图 像 的 离散 余弦 变换 也 可 以 通过 式 (27140 所 示 的 矩阵 变换 进行 。 在 矩阵 变换 之 前 ， 要 
先生 成 离散 余弦 变换 矩阵 。 例 程 2-16 是 生成 离散 余弦 变换 矩阵 的 MATLAB 源 程 序 。 
例 程 2-16 
function [P,Q |2mydctmtx(T) 
vo 功能 : KARKE BRAI EAS HIC AA RAE [PE 
% 输入 : 工 灰 度 图 像 
% 输出 : P-A RIZE RE P 
9 Q-A HIC IA ABE Q 


% KA ANKE LER RIT IURE 
[M,N |»size(I); 





9o MUS ACRES RIZA E P 


for 1=2:M 
for j=1:M 
P(1,)7sqrt(2/M)*cos(((1-1)*(2*]-1)*p1)/(2*M)); 
end 

end 


P(1,:)osqrt( 1/M); 





% RRAK RIER Q 
for 1=2:N 
for J=1:N 
Q(,j)7sqrt(2/N)*cos(((-1)*(2*j- 1)*p1)/(2*N)); 
end 
end 


Q(1,:)=sqrt(1/N); 
KK K K K K K K K K K FK K K FK K K FK K K FK K K FK K K FK K K FK K K FK K K FK K K FK FK K FK K K FK K K FK K K FK FK K FK FK FK FK FK K FK FK K FK FK K K K K 3K 
MATLAB 图 像 处 理工 具 箱 提 供 了 detmtx 来 生成 离散 余弦 和 矩阵。 其 调用 格式 如 下 。 
D=dctmtx(n) 
例 程 2-17 是 调用 dctmtx 对 图 像 进行 离散 余弦 变换 的 实例 。 其 运行 结束 如 图 2-21 所 示 。 
例 程 2-17 
KK K K K K K K K K K FK K K FK K K FK K K FK K K FK K K FK K K FK K K FK K K FK K K FK K K FK FK FK FK FK K FK K K FK FK K FK FK FK FK FK K FK FK K FK FK K K K K 3K 


% EA RGB 图 像 ， 并 转换 成 灰 度 图 像 
I-imread('pic2.jpg; 
I-rgb2gray(l); 


% 求 灰 上 度 图 像 的 行 数 和 列 数 
[MN]=size(D); 
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% 求 离散 余 弱 和 矩阵 
P-dctmtx(M); 
Q-dctmtx(N); 





% PRESA. DATHXETTABBEXSTL 


I1-double(I); 


Vo 进行 离散 傅 里 叶 变 换 
Idct-P*[1*Q' 





% Az EVER AER ERA. 


subplot(121),imshow(L)title( J5i 46 FE ff"); 
subplot(122),imshow(Idct),title( 5 FAA 
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原始 图 像 


* 弦 变换 后 的 图 像 '); 





图 
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2-21 
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在 讨论 离散 余弦 变换 的 性 质 之 
例 程 2-18 


HI ， 































离散 余弦 变换 后 的 图 像 
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例 程 2-17 的 运行 结 





先 来 分 


) 析 一 下 下 和 面 这 个 程序 的 运行 结果 。 


KK K K K K K K K K K K K K K K K ÞK K K K K K K K K K K ÞK ÞK K K K K K K K K K K K ÞK ÞK K K K K K K K K K K ÞK K K FK FK FK K FK FK K K K K K K K 


% A RGB Ka, HERKIES 


I=imread('pic3.jpg'; 
I-rgb2gray(l); 

D1=I: 

% 进行 离散 余弦 变换 
D2-dct2(D1); 


% 取 余 弦 变 换 后 沧 阵 左上 角 不 同 尺 寸 的 小 区 域 组 成 新 的 矩阵 


s-size(D1); 
P-zeros(s); 
PI-P; 
P2-P; 
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P3=P; 

P1(1:40,1:40)-D2(1:40,1:40); 

P2(1:60,1:60)-D2(1:60,1:60); 

P3(1:80,1:80)-D2(1:80,1:80); 

% TRA AEG AEREE IN CIE EHET A HIOR 0230628 T 
D3-1idct2(D2); 

El-idct2(P1); 

E2-1dct2(P2); 

E3-1dct2(P3); 

% 显示 诛 始 图 像 及 变换 后 的 结 采 

subplot(2,3,1),1mshow(D1); subplot(2,3,2), imshow(D2); subplot(2,3,3),1mage(D3); 
subplot(2,3,4),1mage(E1); subplot(2,3,5), image(E2); subplot(2,3,6);1mage(E3) 


观察 例 程 2-18 的 运行 结果 ， 网 2-22c 是 使 用 离散 余弦 变换 系数 矩阵 D2 复原 出 的 图 像 ， 
图 2-22d 是 用 和 矩阵 P 复原 出 的 图 像 ， 图 2-22e 是 用 和 矩阵 P 复原 出 的 图 像 ， 图 2-22f 是 用 和 拓 
HE P3 复原 出 的 图 像 ，P1l、P2、P3 是 离散 余弦 变换 矩阵 左上 角 的 小 区 域 。 图 2-22e 和 图 2-22f 
己 经 十 分 接近 原始 图 像 了 ， 由 此 可 见 ， 对 图 像 进 行 离 散 余 弦 变 换 后 ， 能 量 主要 集中 在 系数 算 
阵 的 左上 角 。 


" 


— 
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图 2-22 例 程 2-18 的 运行 结果 


ETI 离散 余弦 变换 应 用 : 基于 DCT BENE 


基于 离散 余弦 变换 对 图 像 的 噪声 抑制 原理 如 下 : 一 般 而 言 ， 我 们 认为 图 像 的 噪声 在 离散 
余 驳 变换 结果 中 处 在 其 高 频 部 分 ， 而 高 频 部 分 的 幅 值 一 般 很 小 ， 利 用 这 一 性 质 ， 束 很 容易 实 
现 图 像 的 噪声 抑制 。 当 然 ， 这 会 同时 失去 图 像 的 部 分 细节 。 例 程 2-19 为 基于 离散 余弦 变换 
的 图 像 去 噪 的 MATLAB 源 程序 。 
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例 程 2-19 
K KK K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K FK K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK K FK K K K K 3K K K K 
% 读 取 图 像 
X-umread('pic4.jpg^; 
X-rgb2gray(X); 
ARERR SF 
[m,n]-size(X); 
% 给 图 像 加 噪 
Xnoised-imnoise( X,'speckle',0.01); 
% 输 出 加 噪 图 像 
figure(1); 
imshow(Xnoised); 
%DCT 变换 
Y=dct2(Xnoised); 
I-zeros(m,n); 
Voi PUE ic 
I(1:m/3,1:n/3)-1; 
Ydct-Y.*L 
% 逆 DCT 变换 
Y-uint8(idct2(Y dct)); 
% 结 来 输出 
figure(2); 
imshow(Y); 


LLEELLELLELLLLLLLLLLLLLLLELLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL 


例 程 2-19 的 运行 结果 如 图 2-23 PZR. 


. Figure 1 
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a) b) 
2-23 WFE 2-19 的 运行 结 
a) 添加 噪声 后 的 图 像 b) 去 噪 后 的 图 像 


2.4 图 像 滤波 


图 像 小 波 是 为 了 突出 图 像 中 茶 些 信 息 ， 同 时 抑制 或 去 除 茶 些 不 需要 的 信息 来 所 珊 图 像 质 
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量 的 处 理 方 法 。 例 如 ， 强 化 图 像 的 融 频 分 量 ， 可 以 使 图 像 中 物体 的 轮 廊 更 为 清晰 。 图 像 小 小 
不 以 图 像 你 真 为 原则 ， 其 日 的 主要 有 两 个 : 一 是 改善 图 像 的 视 沉 效果， 提高 图 像 的 清晰 度 ; 
二 是 使 图 像 变 得 更 有 利于 计算 机 的 处 理 ， 如 通过 锐 化 滤波 突出 图 像 的 边缘 轮廓 线 ， 以 便 进行 
各 种 特征 分 析 。 

根据 滤波 处 理 的 作用 域 不 同 ， 图 像 小 波 可 以 划分 为 空域 滤波 方法 和 频 域 滤波 方法 。 空 域 
派 波 是 指 直 接 在 像 么 域 进行 处 理 ， 而 频 域 小 流 尽 指 在 图 像 的 频率 域内 对 图 像 进行 处 理 ， 然 后 
反 变 换 后 即 可 得 到 滤波 以 后 的 图 像 。 此 外 ， 还 有 一 些 特殊 的 滤波 方法 如 同 态 滤 波 和 锐 化 滤 肖 


等 ， 本 节 也 将 一 一 介绍 。 












































室 域 滤波 是 指 借助 模板 对 图 像 进行 邻 域 操 作 ， 输 出 图 像 每 一 个 像素 的 取 值 都 是 根据 模板 
对 输入 像素 相应 邻 域内 的 像素 进行 计算 得 到 的 。 根 据 其 特点 ， 空 域 滤波 一 般 可 以 分 为 线性 和 
非 线性 两 类 处 理 方法 ， 按 照 其 功能 ， 可 以 分 为 平滑 滤波 器 和 锐 化 滤波 器 。 平 滑 滤波 器 主要 实 
现 模 糊 和 去 除 噪声 。 模 糊 主要 是 在 提取 较 大 目标 前 ， 去 除 太 小 的 细节 或 将 目标 内 的 小 间断 连 
接 起 来 。 锐 化 滤波 器 是 为 了 增强 被 模糊 的 细节 边缘 。 

空域 滤波 都 是 基于 模板 卷 积 的 ， 对 图 像 中 任意 的 像素 点 (x,y) 进行 mx n 掩 模 处 理 得 到 的 
响应 为 : 

















mn mn 


mn 
R= WZ + WZ +... + Was (2-15) 
i=l 


其 中 ，w 为 掩 檬 系数 ，z 为 与 该 系数 对 应 的 像素 灰 度 值 ，mz HERPES PRR AN 
将 模板 在 图 像 上 游历 过 历 ， 对 每 个 像 双 都 采用 模板 进行 运算 ， 就 可 以 按照 模板 性 质 的 不 同 ， 
实现 不 同 的 功能 。 访 过程 称 为 基于 模板 的 卷 积 。 

基于 模板 卷 积 的 空域 滤波 的 主要 步骤 为 : 

D 将 模板 在 图 像 中 移动 ， 并 将 模板 中 心 与 图 像 中 的 某 个 像素 位 置 重 合 。 

2) 谈 取 模板 下 各 对 应 像素 的 灰 度 值 和 ， 并 与 模板 的 系数 相 乘 。 

3) 将 所 有 的 乘积 相 加 。 

4) 将 和 赋值 给 模板 中 对 应 位 置 的 像素 。 

下 面 介 绍 几 种 曾 用 的 空域 滤波 方法 。 

d) 邻 域 平均 法 

邻 域 平均 法 是 最 简单 的 空域 处 理 方 法 ， 属 于 线性 滤波 器 ， 其 基本 思想 是 利用 几 个 像素 灰 
度 的 平均 值 代 奉 每 个 像素 的 灰 度 。 对 于 位 置 已 力 处 的 像素 ， 其 灰 度 值 为 f(i, j) ， 平 滑 后 的 灰 
度 值 为 g 念 疡 ， 则 gG, 六 由 包含 导 旋 领域 的 香干 个 像素 的 灰 度 平均 值 所 决定 ， 即 用 〈2-16) 
式 得 到 平滑 的 像素 灰 度 值 

gG 旋 = 三 f(x,y) x,py20,L2,---, N-1 (2-16) 


GG, y)eA 
































式 中 ，A 表示 以 人 刀 为 中 心 的 领域 点 的 集合 ，M 是 A 中 像素 点 的 总 数 。 网 2-24 表示 了 4 个 
邻 域 点 和 8 个 邻 域 点 的 集合 。 
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K]2-24 KUBRA RARE 
a) 4 个 邻 域 点 的 集合 b) 8 个 邻 域 点 的 集合 


邻 域 平均 法 的 平滑 效果 与 所 使 用 的 邻 域 半 径 大 小 有 关 。 半 径 越 大 ， 平 滑 图 像 的 模糊 程度 
越 大 。 邻 域 平均 法 的 优点 在 于 算法 重 单 、 计 算 速 度 快 ， 主 要 缺点 是 在 降低 噪声 的 同时 使 图 像 
产生 模糊 ， 特 别 是 在 边缘 和 细节 处 ， 邻 域 越 大 ， 醒 糊 越 历 害 。 为 了 尽 可 能 减少 恒 糊 失真 ， 有 
人 提出 了 “ 超 限 邻 域 平均 法 ”， 也 就 是 采用 下 列 准则 形成 平滑 图 像 。 





























> f(x,y) en- 让 > f(x,y) >T 
ei, 用 N (x, y)eA (x, y)eA (2-17) 
(x, y)eA 
AP, T 是 一 个 规定 的 非 负 国 值 ， 可 以 根据 图 像 总 体 特性 或 者 局 部 特性 确定 。 当 一 些 操 








和 它们 邻 域 的 差 值 超过 规定 的 T 立 值 时 ， 才 进行 噪声 处 理 ， 否 则 仍 保留 这 些 点 的 像素 灰 度 
值 。 邻 域 取 得 越 大 ， 像 素 点 越 多 ， 则 信 噪 比 提高 越 大 ， 平 滑 效 果 越 好 ， 但 是 网 像 模糊 也 越 严 
重 。 邻 域 平 均 是 以 图 像 模 糊 为 代价 来 换取 噪声 的 减少 的 。 

例 程 2-20 是 实现 邻 域 平均 法 的 MATLAB 程序 ， 其 运行 结果 如 图 2-25 所 示 。 

例 程 2-20 
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x = imread('pic5.jpg^; 
[width,height,dim |-size(x); 
AREIS 模块 12*12 
k-12; 
t=0; 
% 图 像 像 素 类 型 转换 
x = double(x); 
y-X, 
% 用 邻 域 平 均 法 进行 滤波 
for 1=round(k/2):1:(width-round(k/2)+1) 
for j=round(k/2):1:(height-round(k/2)+1) 
for m-i-round(k/2)*-1:1:i*round(k/2)-1 
for n-5j-round(k/2)71:1:j*round(k/2)-1 
s-x(m,n); 
t=t+s; 
end 
end 
y(1,])=round(t/(k*k)); 





e 





" "MATLAB xs*&555:9: 


end 
subplot(1,2,1),1mshow(uint8(x)); 
subplot(1,2,2),imshow(uint8(y)); 
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图 2-25 例 程 2-20 的 运行 结果 
a) 原始 图 像 b) 滤波 之 后 的 图 像 


Æ MATLAB 中 ， 可 以 通过 如 下 指令 实现 邻 域 均值 滤波 。 


H-fspecial('average',n); 
Y-filter2(B,H); 





其 中 , n 为 邻 域 的 大 小 ，B DSEUEURIU —2EZKISE EMASABE, H A URSI SED CUR DC e 
例 程 2-21 EWR BANWA Y ARRE, aAA RER E ES ELI SCR 9] Ig P3 





进行 处 理 的 程序 ， 其 运行 结果 如 图 2-26 所 示 。 
例 程 2-21 





K KK K K K K K K K K K K K K K K K K K K K K K K K FK K K K K FK K FK K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK K FK FK K FK K FK K K K K 3K K K K 
% 读 入 图 像 并 进行 数据 转换 

I-imread(' pic6.jpg); 

I-rgb2gray(I); 

% 添加 椒盐 噪声 

J = imnoise(l,'salt & pepper',0.02); 

% 采用 不 同 大 小 邻 域 的 均值 滤波 器 进行 滤波 
K1=filter2(fspecial('average',3),J); 
K2=filter2(fspecial('average',5),J); 
K3-filter2(fspecial('average',7),J); 

Vo 显示 结 来 

subplot(221), imshow(J) 
subplot(222),imshow(uint8(K 1)) 
subplot(223),imshow(uint8(K2)) 
subplot(224),imshow(uint8(K3)) 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K FK K K K K K K K K K FK FK FK FK FK FK K K K K K K K 
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图 2-26 例 程 2-21 的 运行 结果 
a) 添加 噪声 后 的 图 像 bj)3X3 邻 域 滤波 结果 c) 5X5 邻 域 滤波 结果 ”qd) 7X7 邻 域 滤波 结 


从 例 程 2-21 的 运行 结束 可 知 ， 艾 值 滤波 去 品 时 ， 模 板 大 小 的 选取 至 天 重要 。 一 般 来 
说 ,模板 越 大 ， 去 噪 能力 残 越 强 ， 但 同时 也 会 使 图 像 变 得 模糊 。 原 因 在 于 : 均值 滤波 时 采用 
了 平均 操作 ， 疼 像 数 据 本 身 也 会 因为 平均 而 变 得 模糊 。 

(2) 加 权 均 值 滤波 

为 了 殉 服 简单 局 部 平均 的 整 病 ， 目 前 已 经 研究 提出 了 许多 保留 边缘 细节 的 局 部 平滑 算 
法 ， 它 们 讨论 的 重点 都 在 如 何 选择 领域 的 大 小 、 形 状 和 方 同 ， 如 何 选择 参加 平均 的 点 数 以 及 
邻 域 各 氮 的 权重 系数 等 。 把 这 类 根据 参与 平均 像素 的 特点 赋予 不 同 权 值 的 方法 称 为 加 权 均 值 
涯 波 ， 第 用 的 有 灰 度 最 近 K 个 邻 氮 平 均 法 、 柳 度 倒 数 加 权 平 请 、 最 大 均匀 性 平 请 、 小 斜面 醒 
型 平滑 等 。 

一 般 来 讲 ， 可 以 按照 下 列 准则 来 确定 参与 平均 的 各 像素 的 权 值 。 

> 行 处 理 的 像素 赋予 较 大 的 权 值 ， 其 他 像 系 的 权 值 均 较 小 。 

> 按照 距离 符 处 理 像 际 的 远近 人 硝 定 权 值 ， 距 离 待 处 理 像 隶 较 近 的 像 隶 赋予 较 大 的 


















































公 值 。 
> 按照 与 竺 处 理 像 了 么 的 灰 度 接近 程度 确定 权 值 ， 与 待 处 理 像 系 灰 度 较 接近 的 像素 赋予 
较 大 的 权 值 。 











为 了 不 使 整个 图 像 在 平滑 后 变 亮 ， 需 要 将 权 值 进行 归 一 化 处 理 。 下 面 介绍 一 种 最 常见 的 
加 权 平 均 法 一 一 梯度 倒数 加 权 法 。 
在 一 幅 数字 图 像 中 ， 相 邻 区 域 的 变化 大 于 区 域内 部 的 变化 ， 同 一 区 域内 部 中 间 像 素 的 变 
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化 小 于 边缘 像素 的 变化 。 在 图 像 变 化 缓慢 的 区 域 ， 灰 度 梯 上 度 值 小 ; 在 图 像 变 化 较 快 的 区 域 ， 
灰 度 标 硫 值 大 。 当 以 灰 肛 梯度 倒数 作为 权 值 时 ， 区 域内 部 的 邻 点 像 双 的 权 值 束 比 区 域 边缘 或 
者 区 域外 的 邻 点 像素 的 权 值 大 。 此 时 平滑 的 页 献 主 要 来 目 区 域内 部 的 像素 ， 平 请 后 岁 像 边缘 
和 细 市 不 会 受到 明显 损害 。 这 就 古 梯 度 倒 数 加 权 法 的 基本 思想 。 

假设 像素 点 (i,〗 的 灰 度 值 为 f(i, 7) ， 取 该 像素 的 3x3 的 领域 窗口 ， 其 像素 组 成 为 



































F-| f(ij-l) f, 7) fü, j * 1) (2-18) 
fü-Lj-l) füG-Lj) fG-Llj-l) 
以 灰 度 梯度 倒数 构成 的 权 值 窍 阵 为 


w(i-lj-1) w(i-Llj) w(-Lj-l) 
Ww = 








w(i, j —1) w(i, j) w(i, j +1) (2-19) 


w(i+1,j—1) w(i+1,j) w(i+1,j+1) 





式 中 ，w(i, 有 )= 广 ， 权 值 算 阵 其 他 元 素 为 


w(i+m,j+n)=— A logo 


2» >》 dm, jn) 


m-—-]n--1 


(2-20) 


d(i*m,j-n)- (2-21) 


1 NIME 
|f G m, j € n) - f, j) 
式 中 ，m，n 分 别 为 -1，0，1， 旦 不 能 同时 为 0。 

平滑 输出 为 窗口 像素 分 别 与 对 应 位 置 上 的 权 值 相 乘 ， 即 

















有 (27223 


m=—1 n=-1 





此 外 ， 下 和 面 的 模板 也 是 第 见 的 加 权 平 均 滤 波 模 极 。 


例 程 2-22 是 采用 加 权 平 均 滤 波 模板 H, 对 输入 图 像 进行 加 权 平 均 小 波 的 MATLAB 源 程 
序 ， 运 行 结果 如 图 2-27 Wt. 
例 程 2-22 
KKK K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK K FK K K K K 3K K K K 
% 构造 加 权 平均 滤波 模板 
H=[121 
242 
121]; 
H1-1/16*H; 
% 读 入 图 像 ， 并 添加 椒盐 噪声 








A2 


Ed 


SELERA 








I=imread('pic7.jpg'); 

I1= imnoise(I,'salt & pepper',0.02); 
% XETTUEUK 

J-imfilter(I1,H1); — 
% WRAHA R 
subplot(121),imshow(11) | 
subplot(122),imshow(J) Uu 
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图 2-27 例 程 2-22 的 运行 结 
a) 添加 噪声 后 的 图 像 b) 滤波 后 的 结果 


(3) 中 值 滤波 

如 果 既 要 消除 噪声 又 要 保持 图 像 的 细节 ， 可 以 使 用 中 值 小波。 中 值 滤波 占 古 一 种 非 线 性 
平 请 滤波 器 。 它 的 主要 功能 是 让 与 周围 像 系 灰 度 值 的 赫 比 较 大 的 像素 改变 ， 并 取 与 周围 像 又 
相近 的 值 ， 从 而 消除 扳 立 的 噪声 点 。 它 的 主要 步 又 为 : 

1) 将 模板 在 图 像 中 移动 ， 并 将 模板 中 心 与 图 像 中 的 茶 个 像素 位 置 重合 。 

2) 谈 取 模板 下 各 对 应 像素 的 灰 度 值 。 

3) 将 这 些 灰 度 值 从 小 到 大 排 成 一 列 。 

4) 找 出 这 些 值 里 排 在 中 间 的 一 个 。 

5) 将 这 些 中 间 值 赋值 给 对 应 模板 中 心 位 置 的 像素 。 

二 维 中 值 滤 波 融 的 窗口 形状 可 以 有 多 种 ， 如 线 状 、 方 形 、 十 子 形 、 圆 形 、 克 形 等 ， 









































如 图 2-28 所 示 。 不 同形 状 的 窗口 产生 不 同 的 滤波 效 末 ， 使 用 中 必须 根据 图 像 的 内 容 和 不 同 
o 
© 






















图 2-28 二 维 中 值 滤 波 右 常用 窗口 形状 
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的 要 求 加 以 选择 。 从 以 往 的 经 验 来 看 ， 对 于 有 绥 变 的 较 长 轮廓 线 物 体 的 图 像 ， 采 用 方形 或 者 
圆 形 窗口 比较 适宜 ， 对 于 包含 有 尖顶 角 物 体 的 图 像 ， 则 适宜 采用 十 字形 窗口 。 使 用 二 维 中 值 
滤波 最 值得 注意 的 束 是 保持 图 像 中 有 效 的 细 线 状 物 体 。 

例 程 2-23 利用 中 值 滤 波 去 噪 的 MATLAB 例 程 。 

例 程 2-23 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K FK FK FK FK FK FK K K K K K K K 





























clear 

ARA MRR. IARE, JER 
A=imread('pic8.jpg'); 

A=imnoise(A,'salt & pepper',0.04); 
subplot(1,2,1) 

imshow(A) 

title( 添 加 噪声 后 的 图 像 ) 


% 转 换 图 像 类 型 
A=rgb2gray(A); 
image-double(A); 
[m,n]-size(A); 
% 进 行 中 值 沽 小 并 将 滤波 后 的 结果 显示 
u-zeros( 1,9); 
for 172:m-1, 
for j-2:n-1, 

u(1)-image(1,]);u(2)-image(1,]- 1);u(3)-1mage(1-1,j--1); 

u(4)-image(1-1,j);u(5)-image(1-1,j-1);u(6)-1mage(1,j-1); 

u(7)-image(1*1.,j-1);u(8)-image(1*1,]);u(9)-1mage(1*1,]-1); 

for p-1:8, 

for q-1:8-p, 
if u(q)>u(qt1) 
k-u(q);u(q)-u(q*1);u(q*1)-k; 
end, 
end, 
end, 
rimage(1,j)-u(5); 
end, 
end, 
subplot(1,2,2) 
rimage-uint8(rimage); 
imshow(rimage) 
title(' 中 值 滤波 后 的 图 像 ") 
K KK K KK K K K K K K K K K K K K K K K K K K K K K K K K K FK K K K K FK K FK K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK K FK K K K K K K K K 
例 程 2-23 的 运行 结果 如 图 2-29 所 示 。 中 值 滤波 较 好 地 去 除了 椒盐 噪声 ， 且 避免 了 均值 
滤波 所 市 来 的 图 像 模 糊 现象 。 
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”添加 噪声 后 的 图 像 — 中 值 滤波 后 的 图 像 











a) b) 
K] 2-29 WFE 2-23 的 运行 结果 
a) 添加 噪声 后 的 图 像 b) 滤波 后 的 结果 
MATLAB 数字 图 像 处 理工 具 箱 提供 了 medfilt2( ) 函 数 来 实现 图 像 的 二 维 中 值 滤波 ， 其 用 
TU P. 


B-medfilt2(A,[m n]); 


KHF, ANNMARIE, B 是 中 值 滤波 后 输出 的 结果 ，[m n] 用 于 指定 滤波 模板 的 大 小 ， 如 
果 不 设 置 ， 则 默认 为 3x3。 

例 程 2-24 是 调用 medfilt2() 函 数 来 实现 图 像 的 二 维 中 值 滤 波 的 MATLAB 源 程序 ， 其 运 
行 结果 如 图 2-30 所 示 。 

例 程 2-24 


% 读 入 原始 图 像 ， 添 加 椒盐 噪声 
I-imread(' pic10.jpg"); 








I-rgb2gray(l); 

J-imnoise(I,'salt & pepper',0.04); 
% 进 行 中 值 滤波 
K-medfilt2(J,[3,3 ]); 
subplot(121), imshow(J) 
subplot(122), imshow(K) 
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图 2-30 HFE 2-24 的 运行 结果 
a) 添加 噪声 后 的 图 像 b) 滤波 后 的 结果 
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频 域 线性 滤波 和 空 滤 波 一 样 ， 其 基础 都 是 郑 积 定理 。 假 设 函 数 f(x,y) 与 线性 移 不 变 系 
Zt ER. A(x, y) 卷 积 的 结果 是 g(x,y)， 即 满 g(x,y)= f(x,y)*h(x,y) 。 其 中 ,“* ”表示 两 个 
水 数 的 卷 积 。 根 据 卷 积 定 理 ， 时 域 的 卷 积 等 效 为 频 域 的 乘法 ， 妈 h(x,y)* f(x,y) H (u,v) 
F(u,v). KEW G(uv)-H(uv)F(u,v). EF, H(u,v) 8I F(u,v) 分别 为 h(x,y) 和 f (x, y) 
EEEH, H (u,v) HIENE DRA. 

内 此 ， 频 域 滤 波 的 关键 是 选择 一 个 合适 的 滤波 器 传递 函数 ， 以 便 将 FF(w,v) 修改 为 
玉 (u,v)。 从 概念 上 讲 ， 频 域 滤 波 是 比较 简单 和 直观 的 。 频 域 滤波 的 基本 步 又 是 : 

1) 计算 需要 增强 网 像 的 傅 里 时 变换 。 

2) 乘 以 一 个 滤波 传递 函数 有 H(u,v)。 

3) 将 得 到 的 结果 进行 健 里 叶 反 变换 ， 得 到 g(x,y) 。 

这 时 ， 可 以 将 g(x,y) 视 为 f(x,y) 经 过 频 域 小 波 后 的 图 像 。 和 常用 的 图 像 增 强 方法 有 低 通 
滤波 、 融 通 滤 波 、 和 市 通 滤波 、 市 阻 滤波 和 同 态 滤波 。 

(1) HARMI Ar 

Ig CRAB MIB JEJE ASIE ELP: ARTS EERE RR KI AUA MELE 7J 18 E IR] 
K D, EA PISIS 2I, BDUPEAEOB VEIAS IT) — 28 e E RANON 











1 D(u,v)< D, 
0 D(u,v)> D, 


ey -| (2723) 





图 2-31 所 示 的 是 理想 低 通 滤波 器 的 示意 图 。 然 而 ， 这 种 理想 低 通 小 波峰 是 无 法 采用 电 
子 髓 件 实现 的 ， 尽 管 它 可 以 在 计算 机 上 仿真 实现 。 实 际 上 第 用 的 低 通 滤 流 器 主要 有 巴特 添 思 
低 通 滤波 露 、 指 数 低 通 滤波 需 等 。 


H(u,v) 





D(u,v) u WN 


图 2-31  FEAMEOB JETER ZI R4 K] 
(2) PRA MEOB JS AS 
规 止 频率 距离 原点 的 距离 为 Dj, nR ERRERA EAr COBLPTO 的 传递 函数 的 定 


H(u,v) = 1 (2-24) 
1-[D(u, v) Dj" 
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Hp. D EUERE, n 为 巴特 沃 思 低 通 小 滤器 的 级 数 〈 阶 数 )。 不 同 于 理想 的 低 通 滤 
Du. HS ER IC ABCUS ER SUUS IRI TC 8] SLUT S NEAN L4 D(u,v) 远 小 于 D, 时 ， 
(u,v) 将 接近 于 1; 当 D(w,v) 远 大 于 DD F, Hu, KRET 0。 阶 数 n 越 高 ， 巴 特 沃 思 低 
通 滤波 器 越 接近 于 理想 的 低 通 滤波 器 。 > 

例 程 2-25 对 人 为 添加 了 少量 椒盐 噪声 的 图 像 进 行 巴 特 沃 思 低 通 滤 波 ， 其 运行 结果 如 
图 2-32 所 示 。 

例 程 2-25 


KK K K K K K K K K K K K K K K KK K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK ÞK K FK FK FK K FK K K K K K K K K 











I-imread(' pic8.jpg'); 

I=rgb2gray(1); 

LESSE 

J1-imnoise(I,'salt & pepper); 

subplot(1,2,1) 

imshow(J1).title( Ji 45 [E] f") 

% 数据 类 型 转换 ，MATLAB 不 支持 图 像 的 无 符号 整 型 的 计算 
f-double(J1); 

% 健 里 叶 变 换 

g-ffOX(f); 

g-fftshift(g); 

[M,N Jesize(g); 

% —BfrEVERHKI(Butterworth)fKOB JE Yx 88 
nn-2; 

d0-25; 

m-fix(M/2); n-fix(N/2); 

% 计算 低 通 滤波 器 传递 函数 


for i-1:M 
for j-1:N 
d-sqrt((i-m)^2-(j-n)^2); 
h-1/(1--0.414*(d/d0)^(2*nn)); 
result(i,j)-h*g(i.j); 
end 
end 


result-ifftshift(result); 
J2-1fft2(result); 
J3-uint8(real(J2)); 
% 显示 滤波 处 理 后 的 图 像 
subplot(1,2,2) 
imshow(J3),title("J& 73 Ah EUG I HR!) 
K KK K K K K K K K K K K K K K FK K K K K FK K K K K FK K FK K K FK K FK K K FK K FK K K FK K FK K FK FK K FK K FK K K FK K FK FK K K K FK K FK K K 3K K K 
(3) JEŽURMIEW AS 
指数 低 通 滤波 器 是 用 来 帮助 寻找 空间 域 和 频 座 域 乙 间 的 重要 联系 的 ， 其 传递 函数 为 
D(u,v),, 


H(uv)-e ^ (2-25) 
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图 2-32 例 程 2-25 的 运行 结果 
a) 添加 噪声 后 的 图 像 b) 滤波 后 的 结 


Ep, D 是 截止 频率 。 当 n=2，D(w,v) = D, 时 ， 传 递 函 数 降 为 最 大 值 的 1/ V2。 
例 程 2-26 对 人 为 添加 了 少量 椒盐 噪声 的 图 像 进 行 了 一 个 2=2 ， 和 截止 频率 D, = 25 的 指 
数 低 通 滤波 。MATLAB 程序 代码 如 例 程 2-26 所 示 ， 图 2-33 为 例 程 2-26 的 运行 结果 。 
例 程 2-26 
FK KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K FK K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK K FK FK K K K FK K FK K K K K K 
I-imread('picl0.jpg); 
I-rgb2gray(l); 
% 登 加 椒盐 噪声 
I2=Imnolse(L'Salt & pepper',0.05); 
subplot(1,2,1);imshow(I2);title('I 7" [E] f£"); 
% 数据 类 型 转换 ，MATLAB 不 文 持 图 像 的 无 符号 整 型 的 计算 
f-double(I2); 
% 傅 里 叶 变 换 
k-fft2(f); 
g-fftshift(k); 
[N1,N2]-size(g); 
% 构造 指数 低 通 滤波 器 进行 滤波 
n-2; 
d0=25; 
u0=round(N 1/2); 
vO=round(N2/2); 
for 1=1:N1 
for J=1:N2 

d=sqrt((i-u0)^2+(j-v0)^2); 

h=exp(-(d/d0)^n); 

y(,)-h*g(1); 

end 

end 
y-ifftshift(y); 
El-iff2(y); 
E2-uint8(real(E1)); 
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% 显示 滤波 处 理 后 的 图 像 
subplot(1,2,2);imshow(E2):title(' 滤 波 后 的 图 像 "); 
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a) b) 
图 2-33 WFE 2-26 运行 的 结果 
a) 添加 噪声 后 的 图 像 b) 滤波 后 的 结 


(4) SEARJE AS 

AT EI TIE KARIM VE DC e XB L IE R 81 E RE 168 BE ver RU) 6 BREER o ARVE A 
BEIT “RERE” BIHER RAURIS KME. AAAF KS EN E KRAI ALTE -o 
它 的 目的 是 突出 图 像 的 边缘 信息 ， 加 强 其 图 像 的 轮廓 特征 。 从 图 像 增强 的 角度 看 ， 它 是 与 图 
像 平滑 相反 的 一 类 处 理 。 由 于 高 通 滤波 可 以 增强 图 像 的 边缘 和 轮廓 ， 可 以 视 为 一 种 特殊 的 图 
像 增强 操作 。 

理想 的 局 通 小 流 兹 是 直接 “截断 ” 伟 里 叶 变 换 中 的 低频 成 分 ， 仪 通过 频 识 为 指定 的 频率 
D, 以 上 的 蜗 频 成 分 。 理 想 融 通 小 波 占 的 二 维 传递 函数 为 
1 D(wv)2D, 
0 D(u,v)«D, 











ry -| (2-26) 





AA, PPE VE AR IE JGUACDKAM Rd s PSCHABU, RVEUE HIE EWTTEBL EDI ECC 
Jb. EKE, fO H, Qs v) ERME EIFE ER ER IG RT RR HAS 9 E ILU SCUR TE PETER 
EACH, (u,v) ， 它 们 之 间 满 足 : 

H,, (u,v)=1- H (u,v) (2=27) 

图 2-34 所 示 的 是 理想 高 通 小 波 融 的 未 总 图 。 


H(u,y) 
H(u,v) 


Dv) 
00 y N 


图 2-34 ”理想 高 通 滤波 器 示意 
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(50 ERRE AJEA 
截止 频率 为 D HI n W CURSELK 83 e EVE Ar HT e 38 RAAN 





l 


A (2-28) 
1+[D, / D(u, v)" 


H (u,v) = 











HRA SE AAN ERRA A RE E A eA ar E P E 
SUR E EA A ERE E AR A MERIDA KEH ERRAR A mE a 
得 到 的 输出 图 像 振 铃 效 应 不 明显 。 

5 D(u,v)= Do 时 ，H(u,v)=1/2。 为 一 个 通常 的 截止 频率 是 使 太 (u,v) 降低 到 最 大 值 的 
1/ V2 时 的 频率 。 这 时 ， 传 递 函数 变 为 








l 


_ 1 — (2-29) 
1- (42 - DID, / D(u, v)" 


H (u,v) 








例 程 2-27 NECI M sa dE CaRII— T 3591, Haiefrss Wt ünk 2-35 所 示 。 
例 程 2-27 





FK KK K K K K K K K K K K K K K K K K K K K K K K K FK K K K K FK K FK K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK K FK FK K K K FK K FK K K 3K K K 
% 该 入 RGB 图 像 并 将 其 转换 成 灰 度 图 像 
I-imread('pic9.jpg; 
I-rgb2gray(lI); 
subplot(1,2,1); 
imshow(I) 
title( 原始 图 像 ) 
% 数据 类 型 转换 ，MATLAB 不 文 持 无 符号 数学 的 计算 
f-double(I); 
% 傅 里 叶 变 换 
k-fft2(f); 
g-fftshift(k); 
[M,N Jesize(g); 
% —BrUVEREA Hind ye. TEILE 25 
nn-2; 
d0=25; 
m-fix(M/2); 
n—fix(N/2); 


% FIRN E PR 
for i-1:M 
for j-1:N 
d-sqrt((i-m)^2-(j-n)^2); 
if(d==0) 
h=0; 
else 
h=1/(1+0.414*(d0/d)^(2*nn)); 


end 
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result(i,j)-h*e(i,j); 
end 


end 


result-ifftshift(result); © 


J2=ifft2 (result); 

J3-uint8(real(J2)); Vcn Au — 
subplot(1,2,2); 

imshow(J3); 

title(' 滤 波 之 后 的 结果 ') 


LERELLLLLLLLLLLLLLLLLLELLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLEILI 





图 2-35 例 程 2-27 运行 的 结果 
a) 原始 图 像 b) 滤波 后 的 结 


由 小 流 得 到 的 结果 可 以 看 出 ， 相 对 于 理想 融通 滤波 占 ， 巴 特 沃 思 高 遂 滤 波 占 没有 了 了 振 铃 





现象 ， 它 比 理 想 小 波 右 的 滤波 效果 要 好 ， 图 像 的 蜗 频 部 分 比较 突出 。 
(6) TEE IE ibas 
ITEM URS TF. THÉ nE rE HJ OR T8 TR T DR] o 5 p 4 Jy 7 [8] FID 
的 。 截 止 频 京 为 D, 的 n 阶 指数 高 通 滤波 右 的 传递 函数 为 
H(u,v) = g US Deo] (2-30) 
参数 n WARAKA RKK. JAURERRIA, THAO Je DC red TE DUUSS EIS] 
过 渡 处 也 比较 光滑 ， 因 此 用 它 处 理 过 的 图 像 也 没有 明显 的 振 铃 效应 。 
当 D(u,v)= DD 时 ， 万 (u,v)=1/e。 男 一 个 常用 的 传递 函数 是 
H (u, v) = e" 2 Du (2-31) 


EREZA, Huv) 等 于 最 大 值 的 1/V2 。 指 数 高 通 滤波 器 得 到 的 结果 比 前 面 的 
两 种 滤波 需 都 更 为 平滑 ， 即 使 是 对 微小 物体 和 细 条 ， 用 指数 局 通 滤 波 句 过 小 也 是 较为 清 
Wr TS o 

设计 一 个 n=1〔 即 一 阶 传递 函数 )、 截 止 频率 为 5 MIRA EAA RETIE., 


y 一 ^ 


MATLAB 程序 代码 如 例 程 2-28 所 示 ， 几 2-36 是 其 运行 结 
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例 程 2-28 





KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K K FK K K K K K ÞK K K FK FK FK FK FK FK K K K K 2K 2K FK 


9o 该 入 图 像 ， 并 将 其 转换 成 灰 度 图 像 
I-imread('pic13.jpg); 
I-rgb2gray(l); 
subplot(1,2,1); 
imshow(L,title( Ji 45 E] f"); 
% 数据 类 型 转换 ，MATLAB 不 支持 无 符号 整 型 的 数学 计算 
f-double(I); 
% TREE 
k-fft2(f); 
g-fftshift(k); 
[N1,N2]-size(g); 
% 构造 一 阶 截 止 频率 为 5 的 指数 高 通 滤波 器 
n=l; 
d0=5; 
u0=round(N 1/2); 
vO=round(N2/2); 
for 1=1:N1 
for J=1:N2 
d=sqrt((i-u0)^2+(j-v0)^2); 
h=exp(-(d0/d)^n); 
yGJ)=b*g(.j); 
end 
end 
% ITRE 
y=ifftshift(y); 
El=ifft2(y); 
% 显示 处 理 结 来 
E2=uint8(real(E1)); 
subplot(1,2,2); 
imshow(E2),title("JE 2X Jr: f] £i 3&2); 


LEEELLLLLLLLLLLLLLLLLLELLELLLLLLLLLLLLLLLELLLLLLLLLLLLLLLLLELLLLLLLLLLEIL 





K| 2-36 WFE 2-28 运行 的 结果 
a) ja b) 滤波 后 的 结果 
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25 ”图像 的 小 波 变 换 


e 








小 波 分 析 (Wavelet Analysis) 是 20 世纪 80 年 代 中 期 发 展 起 来 的 一 门 数学 理论 和 方 
法 ， 它 是 由 法 国 科 学 家 Grossman 和 Morlet 在 进行 地 震 信 和 号 分 析 时 提出 的 ， 随 后 得 到 迅速 
发 展 。1985 年 Meyer 在 一 维 情形 下 证 明了 小 波 函 数 的 存在 性 ， 并 在 理论 上 作 了 深入 的 研 
2t. Mallat 基于 多 分 辩 分 析 的 思想 ， 提 出 了 对 小 波 应 用 起 重要 作用 的 Mallat 算法 ， 它 在 小 波 
分 析 中 的 地 位 相当 于 FFT 在 经 典 傅 里 时 变换 中 的 地 位 。 小 波 分 析 理 论 的 重要 性 及 应 用 的 广 
泛 性 引起 了 科技 界 的 高 度 重 视 ， 小 波 分 析 的 出 现 被 认为 是 傅 里 时 分 析 的 突破 性 进展 。 科 研 工 
作者 在 逼近 论 、 微 分 方程 、 模 识 识别 、 计 算 机 视觉 、 图 像 处 理 、 非 线性 科学 等 方面 使 用 小 波 
分 析 取 得 了 许多 突破 性 进展 。 

小 波 变 换 的 基本 思想 类 似 于 傅 里 叶 变 换 ， 就 是 用 信号 在 一 秘 基 函数 形成 空间 上 的 投影 
征 该 信号 。 经 典 的 傅 里 时 变换 把 信和 号 按 正 弱 基 展开 ， 将 任意 函数 表示 为 具有 不 同 频率 的 谐 波 
国 数 的 线性 县 加 ， 能 较 好 地 摘 述 信号 的 频率 特性 ;但 它 在 时 域 上 无 任何 分 辨 ， 不 能 作 局 部 分 
析 。 这 在 理论 和 应 用 上 都 限制 了 传 里 叶 变 换 的 发 展 。 小 波 变 换 在 时 域 和 频 域 同时 具有 恨 好 的 
局 部 化 性 能 ， 有 一 个 灵活 可 变 的 时 间 - 频 率 窗 ， 它 与 傅 里 叶 变 换 相 比 ， 能 更 有 效 地 从 信号 中 
提取 信息 ， 通 过 伸缩 和 平移 等 运算 功能 对 函数 或 信号 进行 多 尺度 细 化 分 析 〈Multiscale 
Analysis )， 解 决 了 傅 里 叶 变 换 不 能 解决 的 许多 问题 ， 因 而 ， 小 波 变换 被 党 为 是 “数学 显 微 
镜 ” 它 是 信号 处 理发 展 史 上 的 里 程 碑 。 

这 里 通过 一 个 例子 来 说 明 傅 里 叶 变 换 与 小 波 变 换 的 联系 和 区 别 。 歌 声 是 一 种 声 首 振东 的 
波 函 数 ， 其 傅 里 叶 变 换 就 是 将 这 个 波 函 数 转 化 成 菜 种 乐谱 。 但 遗憾 的 是 ， 傅 里 叶 变 换 无 法 肥 
映 信 号 在 哪 一 时 刻 有 蜗 首 ， 在 哪 一 时 刻 有 低 普 ， 因 此 结果 是 所 有 的 首 和 从 都 挤 在 了 一 起 ， 
如 图 2-37 所 示 。 

小 流 变 换 有 效 地 殉 服 了 傅 里 时 变换 的 这 一 缺点 ， 信 号 变换 到 小 流域 后 ， 小 波 不 仅 能 检测 
到 高 音 与 低音 ， 而 且 还 能 将 高 音 与 低音 发 生 的 位 置 与 原始 信号 相对 应 ， 如 图 2-38 所 示 。 

小 波 分 析 的 应 用 是 与 小 波 分 析 的 理论 研究 紧密 地 结合 在 一 起 的 。 现 在 ， 它 已 经 在 科技 
信息 产业 领域 取得 了 令 人 瞩目 的 成 束 。 从 数学 角度 来 看 ， 信 号 与 图 像 处 理 可 以 统一 看 做 是 
信号 处 理 ( 图 像 可 以 看 做 是 二 维 信 号 )， 小 波 分 析 的 许多 应 用 都 可 以 归结 为 信号 处 理 问 
题 。 现 在 ， 对 于 性 质 随时 间 变 化 而 稳定 不 变 的 信号 ， 处 理 的 理想 工具 仍然 是 傅 里 时 分 析 。 
但 是 实际 应 用 中 的 绝 大 多 数 信 号 是 非 稳定 的 ， 而 适用 于 处 理 非 稳定 信和 二 的 工具 就 是 小 波 
4] WT 

由 于 小 波 分 析 可 以 将 信号 或 图 像 分 层 按 小 波 基 展 开 ， 可 以 根据 图 像 信 号 的 性 质 和 事先 给 
定 的 处 理 要 求 展 开 到 特定 的 级 数 ， 这 样 不 仪 可 以 有 效 地 控制 计算 量 ， 满 足 实时 处 理 的 需要 ， 
而 且 还 可 以 方便 地 实现 累进 传输 编 妈 。 同 时 ， 小 波 变 换 上 共有 放大 、 红 小 和 平移 的 数学 显微镜 
的 功能 ， 能 够 很 方便 地 产生 各 种 分 辩 率 的 图 像 ， 从 而 适用 于 不 同 分 辨 率 图 像 的 IO 设备 和 不 
同 传输 速率 的 通信 系统 。 
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Fourier 分 量 Fourier! RÉ 





小 波 分 量 小 波 乐 谱 





0 时 间 


f(D 








图 2-37 ”歌声 信号 与 傅 里 时 分 解 图 2-38 歌声 信号 与 小 波 分 解 
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4) WT. CT 成 像 、 地 震 勤 探 和 分 形 力学 等 。 
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CD. 基本 小 波 
基本 小 波 又 称 小 波 母 函 数 ， 它 是 一 个 具有 特殊 性 质 的 实 值 函 数 ， 其 振荡 快速 衰减 ， 且 在 
数学 上 满足 积分 为 零 的 条 件 : 


| _wCodx=0 
并 且 ， 它 的 频 证 满足 条 件 
C, = ret as «0 
EIE A ^ NUBE CE BUSES, ELT EF IEIR ES M 


—8l NBCRE ER 2c n] E BE A NOB IEOEERRMR ARI IE s 


va mv [1 


AP, a 为 伸缩 因 于 ，2 为 平移 因子 。 
连续 小 波 变 换 也 称 为 积分 小 波 变 换 ， 定 义 为 














X20 CEASERS 





W, (a.b) e (s) [rovs eod o [7 foo, [Jas 


可 以 证 明 ， 大 采用 的 小 波 满 足 容许 条 件 ， 则 连续 小 波 变 换 存 在 看 逆 变 换 ， 其 闻 变 换 公式 


1 00 P oo da 
f= J, | We by Cb 
与 一 维 信 号 相对 应 ， 二 维 连续 小 波 基 函 数 定义 为 ; 


-b, y-b 
vas sD- - 








a a 
二 维 连续 小 波 变 换 为 : 
W (asbsb,)=| | fous, Cy)dxdy 


HERRN 


1 00 f 00 00 d 
fe») =E h, ] JL Geb sb, Gs y)db,db, F 
yY 


2.5.3 ETUDE: 

在 数值 计算 中 ， 需 要 对 小 波 变换 的 尺度 因子 、 位 移 因 子 进 行 离散 化 ， 一 般 采 用 如 下 的 离 
BUT Xe 
令 尺 度 因子 a = ü SD = ka,” b, (其 中 Q7 1,5z0,m,n 为 整数 )， ANI ER CJ 


| h 区 一 i 
ay Xo 
EHR A, ay. by 使 h(x) 构成 规范 正 交 基 。 
通常 采用 w = 2, b, =1 构 成 离散 二 进 小 波 。 例 如 ， 在 平方 可 积 函 数 空间 L(R) 中 ， 最 典型 
的 规范 正 交 基 是 Haar 基 ， 取 am =2, b, =1 时 ， 小 小 函数 族 为 


h(x) = LIE) 








h(x)= 

















(OD 多 分 辩 分 析 

基本 小 流通 过 伸缩 构成 一 组 基 函 数 ， 在 大 尺度 上 ， 脱 胀 的 基 函 数 搜索 大 的 符 征 ， 而 在 较 
小 的 尺度 上 ， 它 们 则 寻找 细 市 信息 。 

(2) 快速 小 波 变 换算 法 (FWT) 

利用 双 带 子 带 编 码 述 代 ， 目 的 同上 建立 小 波 变 换 。 首 先 按照 低 半 带 和 局 半 带 进行 子 市 编 
人 码 后 ， 对 低 半 带 再 一 次 进行 子 带 编码 ， 得 到 一 个 W/2 点 的 高 半 带 信和 号 和 对 应 于 区 间 [0,sw | 的 
第 一 和 第 二 个 1/4 区 域 的 两 个 N/4 点 的 子 帝 信号 。 然 后， 连续 进行 上 述 过 程 ， 每 一 步 都 你 留 
局 半 币 信号 并 进一步 编码 低 半 市 信 与 ， 直 到 得 到 一 个 仪 有 一 个 点 的 低 半 带 信号 为 止 。 这 样 ， 
小 波 变 换 系 数 束 是 这 个 低 半 市 点 再 加 上 全 部 用 子 带 编 码 的 局 半 带 信和 号。 最 前 面 的 N/2 个 系 












































A MATLAB tranteri 
ZIOK HT EFC) 的 高 半 市 ， 接 下 来 N/A OREL T 28 — VA 市 ， 依 次 类 推 。 图 2-39 给 出 了 
离散 小 波 变 换算 法 的 处 理 流程 。 


t en] HO rem] 
Cs} 


g1(2IAL) g (4At) g (81At) 
图 2-39 ”离散 小 波 变 换算 法 
上 述 算 法 被 称 为 快速 小 波 变 换 (Fast Wavelet Transform，FWT)， 也 因 其 形状 而 被 称 为 
“ 鱼 肯 型 算法 ” 其 逆 变 换 如 图 2-40 Br. 


(Eee mo 


g4(SIAL) g (4At) g ist) 


图 2-40 ”离散 小 波 逆 变 换算 法 








G) 离 艇 小 波 变 换 的 设计 
根据 子 市 编 公 重 构 公式 ， 在 频率 域 上 有 
F(3)-2 E G (SH, s) ZG, (s)H, 6) 

= F(s)H,(s)Hos) + F(s)H, (s)Ħ (s) 

= F(s)( H6 (s) + H? G)) 
EL, DORE T i A A TDCi EARTE : 

Ho (s)+ Ho(s) -1. 0<|s|< sy 
假设 Ho C) 是 小 波 变换 中 使 用 的 具有 平滑 边缘 的 低 通 滤波 传递 函数 ， 则 相应 的 H, (C) 需 

按 下 式 给 出 。 








Hi(s)=1- Ho (s) 

可 见 ， 设 计 一 个 离散 小 波 变 换 的 任务 就 是 精心 挑选 低 通 滤波 器 。 我 们 称 符合 这 一 条 件 的 
离散 低 通 滤波 器 脉冲 响应 加 (s) 为 尺度 向 量 ， 由 它 产 生 一 个 有 关 的 函数 称 为 尺度 函数 。 尺 度 
向 量 和 尺度 函数 彼此 互相 确定 。 

例如 ， 由 尺度 向 量 加 (k) 到 尺度 函数 的 定义 如 下 。 


d(t) =X M (FD2t -Rh) 
k 
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TA hy (Kk) 后 再 利用 数值 计算 方法 得 到 : 


P(t) = lim (x) 


其 中 ， e 


1, (x) = A2 h (1), x — n) 


JH. BRERA, dE'CAEGNIEPBIEALVH—AKTEBD, KENEAN 
AER. 














(d(t — m),d*(t - n)) - ó 
D, (t) - 2^ (2^ t - k) j20,1:, 20,1] .,2/71 
h(k) 7 (d, (£). d, (0)) 
(4) 二 维 离散 小 波 变换 
为 了 将 一 维 离散 小 波 变换 推广 到 二 维 ， 只 考虑 尺度 函数 是 可 分 离 的 情况 ， 即 
D(x,y)= 6(x)d(y) 

APF, D(x) 是 一 维 矿 度 函数 ， 其 相应 的 小 波 是 到 (xz) ， 下 列 3 个 二 维基 本 小 波 是 建立 二 
维 小 波 变换 的 基础 : 

P'a y =D), V^Qy)- (y Qo), v^ (x y) 2 VG) (y) 

"t ALTA V. — 2H 75 RT RR ER CS T8] L^ (R?) 的 正 交 归 一 基 : 

Pi pny) = P (x-2/m,y-2/n) j20, l=1,2,3,  j,Lm,n 都 为 整数 。 

从 一 幅 和 NxN 的 图 像 f(x,y) FAS, Sp ERNEIRBEEH NIE 2 Hm. WFj=0, R 
EX =2 =1， 也 就 是 原 图 像 的 尺度 。7 值 的 每 一 次 增 大 都 是 尺度 加 倍 ， 而 使 分 辨 率 减 半 。 
在 变换 的 每 一 层次 ， 图 像 都 被 分 解 为 4 个 VA 大 小 相同 的 图 像 ， 它 们 都 是 由 原 图 与 一 个 小 波 
基 图 像 的 内 积 后 ， 再 经 过 在 行 和 列 方向 进行 2 倍 的 间隔 抽样 而 生成 的 。 对 于 第 一 个 层次 
(j=1)， 可 写成 


























fe (m,n) =( f(x,y), D(x -2m,y—2n)) 
fa (m,n) - (f Gc y)! (x -2m, y - 2n) 
fd (m,n) - (f Gs y)? (x - 2m, y -2n)) 
fd (mn) =( f(x,y), P? (x 2m, y - 2n) 
后 续 的 层次 ( > D ， 依 次 类 推 ， 形 成 如 图 2741 所 示 的 形式 。 
若 将 内 积 改 写成 卷 积 形式 则 有 ; 
fga (m,n) =| f (x, y) * D(x,—y) |Qm,2n) 
fi (m,n) =] f G5 y) (Cx,—) |Qm,2n) 
fà (m,n) =| f Gs y)? (x,y) |Qm.2n) 
fi. m,n) =| f G6 y) P? (x, —y) |(2m,2n) 
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原始 图 像 第 一 层 
第 二 层 第 三 层 
图 2-41 二 维 离 散 小 波 变换 
因为 尺度 函数 和 小 波 函 数 都 是 可 分 离 的 ， 所 以 每 个 卷 积 都 可 分 解 成 行 和 列 的 一 维 卷 积 。 
例如 ， 在 第 一 层 ， 首 先 用 加 (-x) M AC 分 别 与 图 像 f(x,y) 的 每 行 作 卷 积 并 丢弃 奇数 列 
(以 最 左 列 为 第 0 ÍT) REXA (N x N)/ 25R VERS REP EM A, (72x) Ih (7x) 相 卷 积 ， 丢 弃 奇 


数 行 〈 以 最 上 行为 第 0 行 )。 络 朱 就 是 该 层 变 换 所 要 求 的 4 个 (N/2)x(N/2) 的 数组 ， 
如 图 2-42 所 示 。 
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行 列 列 行 
图 2-42 DWT 图 像 分 解 步 又 
离散 小 波 逆 变换 与 上 述 过 程 相似 ， 在 每 一 层 ， 通 过 在 每 一 列 的 左边 插入 一 列 零 来 增 频 采 
样 前 一 层 的 4 个 矩阵 ， 接 着 用 加 (x) A GO) 来 卷 积 各 行 ， 再 成 对 地 把 这 几 个 W/2x IN 的 矩阵 
加 起 来 ; 然后 通过 在 每 行 上 和 面 插入 一 行 0 来 将 刚才 所 得 的 两 个 矩阵 增 频 采 样 为 N xN ; 再 用 
h(x) 和 万 (xz) 与 这 两 个 矩阵 的 每 列 卷 积 。 这 两 个 矩阵 的 和 就 是 这 一 层 重建 的 结 
图 2-43 给 出 了 逆 小 波 变 换 图 像 重 建 的 过 程 。 
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图 2-43 DWT 图 像 重建 步骤 


小波 变换 的 步骤 及 特点 


一 维 信号 小 波 变 换 的 步骤 如 下 ， 通 过 对 一 维 信号 小 波 变 换 步 又 的 详细 讲解 ， 布 望 读 者 对 
小 波 变 换 的 实现 过 程 有 更 加 深入 的 认识 。 


D 选择 一 个 小 波 函数 ， 并 将 这 个 小 波 与 要 分 析 。 
的 信号 起 始点 对 章 。 AAA 
2) 计算 在 这 一 时 刻 要 分 析 的 信号 与 小 波 函数 的 。 信号 | 


逼近 程度 ， 即 计算 小 波 变换 系数 C, CRK, MAR 小 
LY 











着 此 刻 信号 与 所 选择 的 小 波 函 数 波 形 越 相近 ， 如 "E 
图 2-44 所 示 。 


3 ) 将 小 波 函 数 沿 时 间 轴 向 右 移动 一 个 单位 时 C-00102 
间 ， 然 后 重复 步骤 D 和 步骤 20 求 出 此 时 的 小 波 变 图 2-44 SEOD OFER 


MRA C, EEyEuGGSTfYEKE. WIE 2-45 所 示 。 
4) 将 所 选择 的 小 波 函 数 矿 度 伸 缩 一 个 单位 ， 然 后 重复 步骤 1) ~R 30 操作， 如 
图 2-46 所 示 。 


C=0.2247 


图 2-45 ”步骤 示意 图 图 2-46 ”步骤 由 示意 图 
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f MATLAB 数字 图 像 处 理 实战 


二 维 小 波 分 解 重 构 可 以 用 一 系列 的 一 维 小 波 分 解 重 构 来 实现 。 
在 小 波 变 换 中 ， 斥 度 与 频率 的 关系 如 下 。 

> PRÈ a 一 压缩 的 小 波 二 快速 变换 的 细 市 一 局 频 部 分 。 

> ARE 4 一 拉 伸 的 小 波 一 缓慢 变换 的 粗 部 一 低频 部 分 。 





对 于 数字 网 像 处 理 ， 小 该 变换 大 致 可 以 总 结 出 以 下 4 个 特点 ， 这 些 特点 使 得 小 波 变 换 比 


较 适 合 于 对 网 像 进行 压缩 、 去 品 、 融 合 等 。 





> 小 波 变 换 的 多 分 辩 率 特性 可 以 对 图 像 进行 不 同 尺 度 的 分 解 ， 从 而 可 以 获取 目标 图 像 
不 同 层 次 的 轮廓 信息 和 细 市 信息 ， 而 且 对 在 茶 个 尺度 的 轮廓 进行 更 小 尺度 的 分 解 
时 ， 可 以 至 现 出 更 小 太 度 的 轮廓 信息 和 细节 信息 。 

小 波 变 换 较 之 于 其 他 几 种 正 区 变换 在 运算 速度 上 要 快 ， 而 且 小 该 变 换 对 图 像 的 分 解 呈 
Mallat 搭 取 分解， 此 分 解 方程 及 其 滤波 右 系 数 对 任意 两 相 邻 太 度 均 你 持 恒 定 。 邦 外 ， 

小 波 变 换 还 具有 集中 信和 号 能 量 的 能 力 ， 这 使 得 经 小 波 变 换 后 图 像 信 息 上 只 集中 在 少数 几 
个 变换 系数 上 ， 这 在 一 定 程度 上 也 有 助 于 降低 小 波 变 换 在 时 间 和 空间 上 的 复 森 上 度 。 

小 波 变 换 在 增加 图 像 分 解 层 次 时 并 没有 引起 数据 量 的 增加 ， 由 于 信号 在 小 波 变 换 域 
中 主要 集中 在 少数 系数 上 ， 因 此 如 果 考 虑 通过 柑 极 大 值 来 精确 近似 原始 信 写 ， 还 能 
减少 小 小 变换 后 的 数据 量 。 

> 由 于 网 像 信 号 突变 点 和 噪声 对 小 波 系数 敏感 性 不 同 ， 使 得 小 流 变 换 在 图 像 去 噪 处 理 
中 也 有 较 好 的 应 用 效果 。 




































































2.5.5 例 程 精 讲 





由 于 二 维 小 波 分 解 重 构 可 以 用 一 系列 的 一 维 小 波 分 解 重 构 来 实现 ， 我 们 先 来 讨论 一 维 小 
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例 程 2-29 是 一 维 小 波 分 解 的 MATLAB 源 程序 ， 小 波 基 采用 的 是 Haar JE. Haar 基本 








小 站 是 定义 在 区 间 [0,1] 上 的 函数 ， 其 数学 表达 陈 为 : 


Haar 小 波 的 波形 图 如 图 2-47 所 示 。 


F(x) 








图 2-47 Haar 小波 波形 


小 波 变 换 的 一 级 分 解 过 程 是 ， 原 始 信 号 分 列 进行 低 通 、 融 遂 滤 波 ， 再 分 别 进行 二 元 下 抽 
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到 的 低频 系数 再 进行 小 波 分 解 ， 是 一 个 递归 过 程 。 
例 程 2-29 
KOK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K KK K K K K KK K K K K K K K K K K K K K K K K K > 
function [cA,cD] = mydwt(x,lpd,hpd,dim) 

% 功能 : 对 输入 序列 x 进行 一 维 离散 小 波 分 解 
% 输入 : x 一 一 输入 序列 
% lpd 一 一 低 通 滤波 紫 
% hpd 一 一 高 通 滤 波 占 














96 dim 小 波 分 解 级 数 
% 输出 : cA 一 一 低频 小 波 分 解 系数 
96 cD 高 频 小 波 分 解 系数 


% 初始 化 cA，cD 

CA=X; 

cD=[ [; 

for 1=1:dim 

vo 低 通 滤波 ， 为 了 提高 运行 速度 ， 调 用 MATLAB 提供 的 卷 积 函数 conv() 
cvI-conv(cA,lpd); 

% 通过 下 抽样 求 出 平均 部 分 的 分 解 系数 
dnl-downspl(cvl); 

% 高 通 滤波 

cvh-conv(cA,hpd); 

% 通过 下 抽样 求 出 本 层 分 解 后 的 细 市 部 分 系数 
dnh-downspl(cvh); 

% 下 抽样 后 的 平均 部 分 系数 进入 下 一 层 分 解 
cA-dnl; 

96 将 本 层 分 解 所 得 的 细 市 部 分 系数 存 入 序列 cD 
cD-[cD,dnh |; 

end 

%%%%%%%%%% 子 函数 %%0%%%%%%%%0%0%0% 
function y=downspl(x); 

% 功能 : 对 输入 序列 进行 下 抽样 ， 输 出 序列 Y 

% 下 抽样 是 对 输入 序列 取 其 偶数 位 ， 舍 弃 奇 数位 。 例 如 x=[x1,x2,x3,x4,x5]， 则 y=[x2,x4]. 
Vo 输入 : x- 待 抽样 的 序列 

% 输出 : y- 抽 样 后 的 序列 














% 读 取 输 入 序列 长 度 
N=length(x); 
% 输出 序列 的 长 度 是 输入 序列 长 度 的 一 半 和 市 小 数 时 取 整 数 部 分 ) 
M=floor(N/2); 
171:M; 
y()-x (2*1); 
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例 程 2-30 是 一 维 小 波 重 构 的 MATLAB 程序 ， 小 波 基 采用 的 是 Haar 小 波 。 
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重 构 则 是 分 解 的 逆 过 程 ， 对 低频 系数 、 噩 频 系 数 分 别 进行 上 抽样 和 低 通 、 局 通 泥 波 处 





理 。 要 注意 重 构 时 同一 级 的 低频 、 高 频 系 数 的 个 数 必 须 相 等 。 
例 程 2-30 





KOK K K K K KKK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 3K K 3K K 
function y = myidwt(cA,cD,lpr,hpr); 

% 功能 : WARNET ROETE A UE R 

Vo 输入 : cA 低频 部 分 的 小 波 分 解 系数 

% cD 高 频 部 分 的 小 波 分 解 系数 

% lpr, hpr TEMA FIEL. EAEN A 

vo 输出 : y——— 重 构 后 的 信号 序列 

















% 求 出 低频 、 高 频 部 分 分 解 系数 的 长 度 
Ica-length(cA); 
lcd-length(cD); 














% 每 一 层 重 构 中 ，cA 和 cD BJISEEEHRNISE, Zi led] T lca, XXI] cA 即 为 重 构 信 号 序列 y 


while (Icd)»-(1ca) 
9o 对 低频 部 分 系数 进行 上 抽样 

upl-upspl(cA); 

% 低 通 疮 积 

cvI-conv(upl,lpr); 

% 取出 本 层 重 构 所 需 的 高 频 部 分 系数 ， 长 度 与 本 层 平 均 部 分 系数 的 长 度 相等 
cD _ up=cD(lcd-lca+l:lcd); 

% 对 高 频 部 分 系数 进行 上 抽样 

uph-upspl(cD up); 

% 局 通 卷 积 

cvh-conv(uph,hpr); 

% 用 本 层 重 构 的 序列 更 新 cA， 以 进行 下 一 层 重 构 

CA=cvl+cvh; 

% 人 铭 径 本 层 重 构 用 到 的 高 频 部 分 系数 ， 更 新 cD 

cD-cD(1:led-1ca); 

% 求 出 下 一 层 重 构 所 用 的 低频 、 高 频 部 分 系数 的 长 度 

lca=length(cA); 

lcd=length(cD); 














end 
% 输出 的 重 构 序列 y 等 于 重 构 完成 后 的 平均 部 分 系数 序列 cA 
y-cA; 


9/99/99/09/09/09/09/09/09/09/6 T EK 44(9/99/09/09/09/09/09/09/09/09/09/9/09/0 
function y—upspl(x); 
% 功能 : 对 输入 的 一 维 序列 x 进行 上 抽样 





% 即 对 序列 x 每 个 元 素 之 间 插 零 ， 例 如 x=[x1,x2,x3,x4], 上 抽样 后 为 y=[x1,0,x2,0,x3,0,x4]: 


% 输入 : x- 街 抽样 的 序列 
% 输出 : y- 抽 样 后 的 序列 





% 读 取 和 输入 序列 长 度 
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N-length(x); 
% 输出 序列 的 长 度 是 输入 序列 长 度 的 2 倍 再 减 1 
M=2*N-1; 
% 输出 序列 的 偶数 位 为 0， 奇数 位 按 次 序 等 于 相应 位 置 的 输入 序列 元 素 
for i-1:M > 
if mod(1,2) 
y@=x(G+1)/2); 
else 








y(1)-0; 
end 


end 
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TENETE HAZRET ERKEN. WE 2-31 和 例 程 2-32 是 
基于 Haar M EEN EM ELFE o 

例 程 2-31 
function [LL,HL,LH,HH |-mydwt2(x); 
% 功能 : 对 输入 的 r*c EERE x 进行 二 维 小 波 分 解 ， 和 输出 四 个 分 解 系 数 子 矩阵 [LLHLLH,HHI] 
Vo 输入 : x 输入 矩阵 ， 为 r*c 维和 矩阵 。 
% 输出 : LL,HL,LH,HH 是 分 解 系数 矩阵 的 四 个 相等 大 小 的 子 和 矩阵 ,大 小 均 为 V2* c/2 维 
% LL: 低频 部 分 分 解 系数 : HL: 对 直方 癌 分 解 系数 ; 
0/6 LH: 水 平方 向 分 解 系数 ;， HH: 对 角 线 方向 分 解 系数 。 











% AARRE, RIBUS DX n 
lpd=[1/2 1/2];hpd7[-1/2 1/2]; 
% 读 取 输入 窍 阵 的 大 小 
[row,col]-size(x); 
% 首先 对 输入 矩阵 的 每 一 行 序列 进行 一 维 离散 小 波 分 解 
for J=1:row 
tmpl-x(j,:); 
[cal,ed1 |-mydwt(tmp]l ,Ipd,hpd,1); 
% 将 分 解 系数 序列 再 存 入 矩阵 xx 中， 得 到 [LIH] 
x(j,:)=[ca1,cd1]; 
end 
% 再 对 输入 矩阵 的 每 一 列 序列 进行 一 维 离散 小 波 分 解 
for k-1:col 
tmp2-x(:,k); 
[ca2,cd2 |2mydwt(tmp2,lpd,hpd,1); 
Vo 将 分 解 所 得 系数 存 入 窍 阵 x 中 ， 得 到 [LL,HLLH,HH] 
x(:,k)7[ca2,cd2]; 
end 
% LL 是 矩阵 x 的 左上 角 部 分 
LL-x(1:row/2,1:col/2); 
% LH 是 矩阵 x 的 左下 角 部 分 
LH-x(row/2-*1 :row,1:col/2); 
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% HL 是 和 矩阵 x 的 右上 角 部 分 
HL=x(1:row/2,col/2+1:col); 
% HH Zé4B PE x 的 右 下 角 部 分 
HH-x(row/2-1:row,col/24-1:col); 
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例 程 2-32 
KOK K K K K K KK K K K K K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 
function y=myidwt2(LL,HL,LH,HH); 
vo 功能 :对 输入 的 子 窍 阵 序列 进行 逆 小 波 变 换 ， 重 构 出 矩阵 y 
% 输入 : LL,HL,LH,HH 一 一 是 四 个 大 小 均 为 rtc 维 的 矩阵 
% 输出 : y 是 一 个 大 小 为 2r*2c 维 的 和 矩阵 





% 默认 的 低 通 、 高 通 滤波 器 
lpr=[1 1];hpr=[1 -1]; 
% FEA IUNE REH S N — AREE 
tmp mat=[LL,HL;LH,HH]; 
% 求 出 组 合 矩 阵 的 行列 数 
[row,col]-size(tmp mat); 
% 首先 对 组 合 窍 阵 tmp mat 的 每 一 列 ， 分 开 成 上 下 两 半 
for k=1:col 
% 分 开 的 两 部 分 分 别 作为 平均 系数 序列 cal、 细 市 系数 序列 cdl 
cal=tmp mat(1:row/2,k); 








cd1=tmp mat(row/2-1:row,k); 
% EHEJ 
tmpl=myidwt(ca1,cd1,lpr,hpr); 
% KETIA ITERE yt 的 相应 列 ， 此 时 y-[L]H] 


yt(:,k)=tmp!1; 
end 

% 将 输出 窍 阵 y 的 每 一 行 ， 分开 成 左右 两 半 
for J=1:row 


% 分 开 的 两 部 分 分 别 作为 低频 系数 序列 ca2、 高 频 系 数 序 列 cd2 
ca2-yt(j,1:col/2); 
cd2-yt(j],col/24-1:col); 
% 重 构 序列 
tmp2-myidwt(ca2,cd2,lpr,hpr); 
% 将 重 构 序 列 存 入 待 输出 矩阵 yt 的 相应 行 ， 得 到 最 终 的 输出 矩阵 y=yt 
yt(j,:)=tmp2; 
end 
y-yt 
为 了 实现 图 像 的 N 层 分 解 ， 对 一 幅 m 行 n 列 的 黑白 图 像 要 对 其 进行 规范 化 处 理 ， 使 其 
能 被 2 的 N 次 方 整除 。 例 程 2-33 便 实现 了 该 功能 。 
例 程 2-33 


LEREELLELLLLLLLLLLLLLLLLELLELLLLLLLLLLLLLLLELLLLLLLLLLLLLLLLLLLLLLLLLLLLL 











function y2modmat(x,dim) 
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% 功能 : 输入 矩阵 x 进行 规范 化 ， 使 其 行列 数 均 能 被 2^dim 整除 








% 输入 : x r*c 维和 矩阵 ; 
% dim FE EE EMI 2E 
% 输出 : y 一 一 rt*ct AEE, mod(rt2^dim)-0, mod(ct,2^dim)-0 A 


% 求 出 输入 矩阵 的 行列 数 row,col 

[row,col]-size(x); 

% 将 row,col Jl Zz 4-5 2^dim 得 到 的 数 ， 所 得 的 产 为 rt、ct， 均 能 被 2^dim 整除 
rt-row - mod(row,2^dim); 

% 输出 矩阵 y 为 输入 矩阵 x 的 rt*ct TIERE 

ct-col - mod(coljà22^dim); —y-x(l:rt,1:ct); 

将 规范 化 后 的 图 像 的 数据 格式 由 适合 显示 图 像 的 uintS 格式 转换 为 适合 数值 处 理 的 
double 格式 ， 再 调用 二 维 小 流 分 解 函 数 进 行 图 像 分 解 ， 最 后 为 了 清晰 地 显示 分 解 网 像 的 塔 陈 
结构 ， 在 图 像 的 相应 区 式 绘 制 知 和 干 分 界线 。 有 基体 程 序 如 例 程 2-34 所 示 。 

例 程 2-34 


LERELLLLLLLLLLLLLLLLLLELLELLLLLLLLLLLLLLLLLELLLLLLLLLLLLLLLLLLLLLLLLLEIL 




















function y-mywavedec2(x,dim) 


% 功能 : AIA BZIERE x 进行 dim 层 分 解 ， 得 到 相应 的 分 解 系数 矩阵 y 








% 输入 : Ox 输入 图 像 矩 阵 
% dim 分 解 层 数 


% 输出 : y 一 一 分 解 系数 窃 阵 


% 首先 规范 化 输入 矩阵 ， 使 其 行列 数 均 能 被 2^dim 整除 
x=modmat(x,dim); 
vo 男 出 规范 化 后 的 图 像 
subplot(121);imshow(x);title( Ji 28 E] ffe); 
9o 求 出 规范 化 矩阵 x 的 行列 数 
[m,n|=size(x); 
% KERERE x 的 数据 格式 转换 为 适合 数值 处 理 的 double 格式 
xd=double(x); 
for 1=1:dim 
xd=modmat(xd,1); 
% 小 波 分 解 
[dLL,dHL.,dLH,dHHI=mydwt2(xd); 
% 将 分 解 系数 存 入 组 存 和 矩阵 
tmp-[dLL,dHL;dLH,dHH]; 
% KRITIEKE ERE) TIEREN FERDA IRAE RE 
xd=dLL; 
% 求 出 绥 存 矩阵 的 行列 数 
[row,col]-size(tmp); 
% 将 绥 存 年 阵 存 入 输出 矩阵 的 相应 行列 
y(1:row,1:col)-tmp; 

















end 


% 将 输出 沧 阵 的 数据 格式 转换 为 适合 显示 图 像 的 uint8 格式 





"P MATLAB 数字 图 像 处 理 实战 


yd=uint8(y); 
% 对 和 矩阵 yd 进行 分 界线 处 理 ， 画 出 分 解 图 像 的 分 界线 
for 1=1:dim 
m-m-mod(m,2); 
n-n-mod(n,2); 
yd(m/2,1:n)-255; 
yd(1:m,n/2)-255; 
m-m/2;n-n/2; 
end 
subplot(122);imshow(yd);title([ num2str(dim) ' Ez NV Z) f Es]; 


KK K K K K K K K K K K K K K K KK K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K K K K K K K ÞK K K FK FK FK K FK K K K K K K K K 


上 述 的 图 像 分 解 程序 ， 其 输出 数据 是 double 型 ， 以 便 作为 重 构 程序 的 输入 。 例 程 2-34 的 
运行 过 程 如 图 2-48 所 示 ， 其 结果 如 图 2-49 Hr. 








Command Window 


:1D0rÉElÉpace 

Tis] rd E=] ES | Stack: | Base w| AD select data to plot 
Hames Žž m | Value | Min Max 
[240x320 uint82 ü 255 
CP40x320 double? =I 253... 


>> I-imread( picl5. jpg ): 
>> I-rgb?gray (I); 
>> y-mywavedec?(I, 2): 


f>] 






图 2-48 WFE 2-34 运行 过 程 


2 层 小 波 分 解 图 像 
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图 2-49 Wf 2-34 的 运行 结果 








Be PoKBRHÉEMEEISERM, fcSuts ETE TR HE 2-35), N T EGCIREA E ES BUNT EC 
图 像 ， 首 先 绘 出 经 过 小 波 分 解 的 图 像 ， 然 后 再 进行 章 构 。 在 绘制 分 解 图 像 和 重 构 图 像 的 过 程 
中 ， 要 注意 数据 格式 的 转换 。 

例 程 2-35 
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function y=mywaverec2(x,dim) 


% 功能 : ”输入 的 分 解 系数 窍 阵 x 进行 dim 层 重 构 








% 输入 : xX 分 解 系数 矩阵 ; 
96 dim 重 构 层 数 ; 
% 输出 : y ERE PE. 





% 绘制 分 解 图 像 
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% 将 输入 矩阵 的 数据 格式 转换 为 适合 显示 网 像 的 uint8 格式 
xd-uint8(x); 
% 求 出 输入 和 窍 阵 的 行列 数 


[m,n|=size(x); > 
% 对 转换 矩阵 xd 进行 分 界线 处 理 

for 二 1:dim 

m-m-mod(m,2); 

n-n-mod(n,2); 

xd(m/2,1:n)-255; 

xd(1:m,n/2)-255; 

m-m/2;n-n/2; 

end 

figure; 

9o mE EANAIR 

subplot(121);imshow(xd);title([ num2str(dim) ' JENERE T; 
% 重 构 图 像 

% 将 输入 算 阵 的 数据 格式 转换 问 适 合 数值 处 理 的 double 格式 
xr—-double(x); 

% 求 出 转换 矩阵 xr 的 行列 数 

[row,col]-size(xr); 

9o 重 构 次 序 是 从 内 层 往 外 层 进 行 ， 所 以 先 抽 取 和 矩阵 xr 的 最 内 层 分 解 矩 阵 进行 重 构 
for i=dim:-1:1 

% 重 构 的 内 层 矩 阵 的 行列 数 均 为 算 阵 xr 的 2^(i-]) 倍 

tmp=xr(] :floor(row/2^(1-1)),1:floor(col/2^(1-1))); 

% RRF EIERE tmp 的 行列 数 

[rt1,ct1]=size(tmp); 

rt=rt1-mod(rt1,2);ct=ct1-mod(ct1,2); 

% ITEE tmp 分 解 为 四 个 部 分 

rLL=tmp(1:rt/2,1:ct/2); 

rHL=tmp(1:rt/2,ct/2+1:ct); 

rLH-tmp(rt/2-*1 :rt,1:ct/2); 

rHH-tmp(rt/271:rt,ct/2*1:ct); 

9o KEWER REEERE tmp 
tmp(1:rt,1:ct)2myidwt2(rTLL,rHL,rLH,rHH); 

% 把 矩阵 tmp 的 数据 返回 到 矩阵 xr 的 相应 区 域 ， 准 备 下 一 个 外 层 的 重 构 
xr(1:rt1,1:ct1)-tmp; 

















end 
vo 重 构 结束 后 得 到 的 矩阵 xr 即 为 输出 矩阵 y 
Y 一 XT， 


% TERRE xr 的 数据 格式 转换 为 适合 显示 图 像 的 uint8 格式 
yu-uint8(xr); 
subplot(122);imshow(yu);title( -hyk Æ ENAN; 
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例 程 2-35 的 运行 过 程 如 图 2-50 所 和 示 ， 运 行 结果 如 图 2-51 所 示 。 
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Tal m E m | Stack: | Base v] AD select data to plot 


>> I-imread( pici5. jpg’); 





>> I=rgb2gray (I); | Value | Min | Max | 

>> y-mywavedec2(I, 2) ; <240x320 uint8? 0 255 

>> x-mywaverec2(y,2); «240x320 double? 0 255 
«240x320 double? -109... 253... 


Eo» 


图 2-50 WIFE 2-35 的 运行 过 程 
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图 2-51 例 程 2-35 的 运行 结果 
a) 小 波 重 构 的 过 程 b) 小 波 重 构 后 的 图 像 


在 MATLAB 7.0 中 有 专门 的 小 波 函 数 工 具 箱 ， 文 持 小 波 在 图 像 处 理 中 的 应 用 ， 表 2-2 和 
K 2-3 主要 列 出 了 小 波 函 数 工 具 箱 中 的 一 维 、 二 维 小 波 应 用 函数 。 
例 程 2-36 是 调用 小 波 工具 箱 中 的 二 维 小 波 处 理 函 数 进行 小 波 分 解 和 重 构 的 MATLAB Ji 

















程序 ， 其 运行 结果 如 图 2-52 所 示 。 


表 2-2 一 维 离 散 小 波 函 数 
Ho» Ei 能 
appcoef 提取 一 维 小 波 分 解 低频 系数 
detclef 提取 一 维 小 波 分 解 蜗 频 系数 
dwt 单 层 一 维 小 波 分 解 
dwtmode 离散 小 波 变 换 扩展 模式 
idwt 单 层 一 维 逆 离散 小 波 变换 
upcoef 一 维 小 波 分 解 的 直接 重 构 
upwiev —TE/ NIA REA] FPES EN 
wavedec 多 层 一 维 小 波 分 解 
waverec 多 层 一 维 小 波 重 构 
wenergy 一 维 小 波 分 解 能 量 函数 
wrcoef 二 维 小 波 分 解 系数 单 文 重 构 
表 2-3 “二 维 离散 小 波 函 数 
ro» J 能 
dwt2 单 层 二 维 小 波 分 解 


dwtper2 





单 层 二 维 离 敬 小 波 变 换 


wavedec2 
idwt2 
idwper2 
waverec2 
upwiev2 
wrcoef2 
upcoef2 
detcoef2 
appcoef2 
wthresh 
wthcoef2 
ddencmp 


wdencmp 


例 程 2-36 
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X fü 
多 层 二 维 小 波 分 解 
单 层 二 维 逆 离 散 小 波 变换 D 
AU — He UAR 
多 层 二 维 小 波 重 构 
二 维 小 波 分 解 的 单 层 重 构 
二 维 小 波 分 解 系数 单 支 重 构 
二 维 小 波 分 解 的 直接 重 构 
提取 二 维 小 波 分 解 高 频 系数 
提取 二 维 小 波 分 解 低频 系数 
进行 软 闹 值 或 硬 闹 值 处 理 
二 维 信号 的 小 波 系数 阙 值 处 理 
获取 在 消 噪 或 压缩 过 程 中 的 默认 阅 值 
用 小 波 进行 信号 的 消 噪 和 压缩 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK K K FK FK FK FK FK FK K K K K K K 2K 


X=imread('pic16.jpg'"; 
X=rgb2gray(X); 

% 提取 分 解 后 的 低频 和 高 频 系 数 
[C,S]>wavedec2(X,2,'bior3.7'); 
cA2-appcoef2(C,S,'bior3.7',2); 
[cH2,cV2,cD2 ]-detcoef2('all',C,S,2); 
[cH1,cV I,cDI ]|-detcoef2('all',C,S,1); 

% 从 系数 C 重 构 第 一 层 低频 系数 

A -—wrcoef2('a',C,S,'bior3.7',1); 

% 从 系数 C. 重 构 第 二 层 低频 系数 
A2-—wrcoef2('a',C,S,'bior3.7',2); 

% 从 系数 C 重 构 第 一 、 二 层 高 频 系 数 

H1-wrcoef2('h',C,S,'bior3.7',1); 

V]-—wrcoef2('v',C,S,'bior3.7',1); 

D1-wrcoef2('d',C,S,'bior3.7',1); 

H2-wrcoef2('h',C,S,'bior3.7',2); 

V2-—wrcoef2(' v',C,S,'bior3.7',2); 

D2-wrcoef2('d',C,S,'bior3.7',2); 

% 显示 
subplot(241) 
imshow(uint8(A1)); 
title(' 低 频 系 数 A1; 

subplot(242) 
imshow(uint8(H1)); 
title7K^- 48 H1; 

subplot(243) 
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imshow(uint8(V 1)); 
title (Œ AM V 15); 
subplot(244) 
imshow(uint8(D1)); 
title(56] ffi dil T V1; 
subplot(245) 
imshow(uint8(H2)); 
title( 水 平 细 而 H2"); 
subplot(246) 
imshow(uint8(V2)); 
title (Œ AM V2; 
subplot(247) 
imshow(uint8(D2)); 
title( 对 角 细 和 V2; 
subplot(248) 
imshow(uint8(A2)); 
title(' 低 频 A2"; 
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低频 系数 Al 水 平 细节 HIl 


垂直 细节 V1 对 角 细 节 V1 





XI faz V2 低频 A2 





图 2-52 小波 分 解 和 重 构 


2.5.6. 小 疲 变 换 的 应 用 : 基于 小 波 变 换 的 图 像 增强 | 


通过 小 波 变 换 可 将 一 幅 图 像 分 解 为 大 小 、 位 置 和 方向 均 不 相同 的 分 量 。 在 做 逆 变 换 之 
前 ， 可 根据 需要 对 不 同位 置 、 不 同方 向 上 的 某 些 分 量 改变 其 系数 的 大 小 ， 从 而 使 得 某 些 感 兴 
趣 的 分 量 被 放大 而 使 某 些 不 需要 的 分 量 减 小 ， 以 达到 图 像 增强 的 目的 。 基 于 小 波 变换 的 图 像 
增强 可 通过 例 程 2-37 来 实现 ， 其 运行 结果 如 图 2-53 Pros. 

例 程 2-37 
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X-1imread('picl7.jpg); 

X-rgb2gray(X); 
subplot(1,2,1):imshow(X),title《' 输 入 图 像 ') 
% 对 图 像 用 db5 小 波 进行 2 层 分 解 
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[c,.]]E 2»wavedec2(X,2,'db5*); 
Csize-sizec; 


AIAS EC BI 1 TRAE RR 


for i-1:Csize(2) wmm 
if(c(i)-300) >) 
c(1)=1.2*c(1); Y 


else A 
c(1)-0.8*c(1); 
end 





end 
% 重 构 并 显示 图 像 
Xl-waverec2(c,l,'db5*); 
X]l-uint8(X1); 
subplot(1,2,2);imshow(X1),title(' 增 强 后 的 图 像 ") 
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a) b) 
图 2-53 WFE 2-37 的 运行 结 
a) 输入 的 原始 图 像 b) 增强 后 的 图 像 


erre e ee ee eee ee ee ee e e e e e e e e e p e e e e e e e e e e e e e e 


| 经 验 分 享 ， 对 小 波 变换 的 理解 
| 小 波 变换 是 将 信号 分 解 为 一 系列 小 波 函 数 的 登 加 ， 而 这 些小 波 函 数 都 是 由 一 个 基 | 
| 本 小 波 函 数 经 过 平移 和 尺度 伸缩 得 来 的 。 j 


———————M————————— ———————— ————— — — — e eee 





可 以 这 样 理 解 小 波 变 换 的 含义 : HERR Hbf om f)» w) 代表 镜头 所 起 的 所 用 ， 
b 相当 于 使 镜 尖 相对 于 目标 平行 移动 ，a 的 作用 相当 于 镜头 向 目标 推进 或 远离 。 由 此 可 见 ， 
小 波 变 换 有 以 下 特 后 。 

> 多 矿 度 /多 分 辩 的 特点 ， 可 以 由 粗 及 细 地 处 理 信 号。 

> 可 以 看 成 用 基本 频率 特性 为 w(w) 的 融通 滤波 右 在 不 同 尺度 a 下 对 信号 做 滤波 。 

> 适当 地 选择 小 波 ， 使 w(D) ENR ENAR, olo) 在 频 域 上 也 比较 集中 ， 就 可 以 

使 WT 在 时 、 颍 域 都 具有 表征 信和 号 局 部 特征 的 能 

小 波 变换 和 傅 里 叶 变 换 一 样 ， 也 是 一 种 积分 变换 ， (E fa HEAR HOP RIA AbdET: 小 

波 变 换 具有 伸缩 因子 和 平移 因子 两 个 参数 ， 所 以 ， 函 数 经 过 小 波 变 换 束 意味 看 一 个 时 间 函 数 
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被 投影 到 二 维 的 时 间 一 一 大 度 相 平面 上 ， 这 样 有 利于 提取 信和 号 函数 的 菏 些 本 质 特征 。 


2.6 Æi Hough 变 
"MOM Hough 变换 的 基本 原理 


和 直线 通常 对 应 和 章 要 的 边缘 信息 ， 和 直线 提取 是 计算 机 视觉 中 一 项 非 第 重要 的 技术 。 例 如 车 
辆 目 动 敬 台 技 术 中 道路 的 提取 逢 要 有 效 地 提取 下 的 道路 边缘 ， 也 就 是 提取 获取 的 图 像 中 的 直 
线 ; 而 航空 照 厂 分 析 中 ， 直 线 更 是 对 应 于 曹 要 的 人 造 目标 的 边缘 。 因 此 把 直线 单独 提取 抽出 
来 研究 很 有 意义 。 而 且 ， 由 于 直线 具有 不 同 于 一 般 曲 线 的 特征 ， 因 此 其 提取 方法 也 与 一 般 的 
X SE UE 7 325 A FH] 
Hough 变换 是 对 二 值 图 像 进行 下 线 检测 的 有 效 方法 ， 其 实质 是 对 图 像 进行 坐标 变换 ， 将 
图 像 军 间 的 点 映射 到 参数 空间 ， 使 变换 后 的 结束 便于 检测 和 识别 。 如 图 2-54 Mar, BRF 
间 的 一 条 直线 1 可 由 式 (2-30〉 所 示 的 参数 方程 表示 : 
p 7 xcosÜ + ysin ð (2-30) 



































p 


P,(0, p) 


Hough 变 换 





图 像 空 间 参数 空间 





K|2-54 Hough 变换 原理 示意 图 


HEt, po 为 坐标 原点 0 到 直线 7 的 距离 ， 2 为 坐标 原点 到 直线 7 的 垂 线 与 x 轴 正方 向 的 
Effo IWA (2-300 式 可 将 图 像 空 间 中 的 任意 一 点 (xz, y) 转换 到 以 p ，2 为 坐标 轴 的 参数 空 
lH]. Hough 变换 具有 如 下 性 质 。 

> 在 图 像 空 间 中 直角 坐标 系 下 的 一 个 点 映射 为 在 参数 空间 极 坐 标 系 下 的 一 条 曲线 。 

> 在 图 像 空 间 中 直角 坐标 系 下 的 一 条 直线 映射 为 在 参数 空间 极 坐标 系 下 的 一 族 有 公共 

交点 的 曲线 。 

> 在 参数 空间 中 极 坐 标 系 下 的 一 个 点 对 应 图 像 空间 直角 坐标 系 下 的 一 条 直线 。 

Hough 变换 采用 参数 方程 表示 直线 比 起 用 (k,c) (斜率 和 截 距 〉 表示 的 方法 ， 解 决 了 与 y 
轴 平 行 直线 斜率 无 法 表示 的 困难 。 

基于 Hough 变换 检测 数字 图 像 中 的 直线 的 步骤 可 以 概括 如 下 。 

D) fEo. 0 合适 的 最 大 值 和 最 小 值 之 间 建 立 一 个 离散 的 参数 空间 。 

20 建立 一 个 累加 器 4(p,0) ， 并 置 每 个 元 素 为 0。 

3) 对 二 值 图 像 的 每 一 个 非 零点 作 Hough 变换 ， 并 算出 该 点 在 -0 空间 上 的 对 应 曲 
线 ， 并 对 相应 的 累加 器 加 1， 即 : 
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A(p,0)= 4(p,0) *1 
4) 找 出 对 应 网 像 平 面 共 线 点 的 累加 器 上 的 局 部 极 大 值 ， 这 个 值 所 在 点 的 位 置 参数 便 是 
所 要 检测 直线 的 参数 。 
由 Hough 变换 的 性 质 及 实现 步骤 可 知 ， 基 于 Hough 变换 检测 直线 具有 抗 干扰 性 好 、 容 > 
错 性 强 的 优点 ;但 也 存在 运算 量 大 、 占 用 内 存 多 的 不 足 。 


APA 例 程 精 讲 


上 面 提 到 的 Hough 变换 的 基本 步骤 ， 可 通过 如 例 程 2-38 所 示 的 MATLAB 语言 来 实现 。 
例 程 2-38 
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function myhough(x) 

% 该 函数 实现 Hough 变换 提取 直线 的 功能 。 
% 输 入 图 像 x， 运 行 之 后 直接 男 出 直线 

% 输 入 的 图 像 x 为 灰 度 图 像 

[m,n -size(x); 

% 转 换 成 二 值 图 像 

bw-edge(x,'prewitt") 

% 求 出 图 像 大 小 
md-round(sqrt(m^2-n^2)); 

Vo iff xt PFE HI e X D k 

ma-180; 

ruthta-zeros(md,ma); 

Vor ^ ETARE RE 

ruthx-cell(1,1); 

%cell 数组 相当 于 c 语言 中 的 指针 ， 可 动态 改变 大 小 


for 171:md 








for j-1:ma 
ruthx {ij j—[]; 








end 
end 
% 产 生 空 网 格 
for i-5:m-4 
for j-5:n-4 
if bw(1,)—— 
for k-1:ma 
ru-round(abs(j *cos(k)-i*sin(k))); 
% 根 据 直 线 的 法 线 式 表示 ， 计 算出 平面 上 不 同 点 的 hough 变换 值 
ruthta(ru+1,k)=ruthta(ru+1,k)+1; 
% 将 hough 变换 值 相应 位 置 的 计数 值 加 1 
ruthx (ru 1,k]-[ruthx (ru 1,k3 [1,j ]']; 
AWK hough 变换 值 相应 位 置 对 应 的 点 的 坐标 
end 
end 


end 
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end 

figure 

bw=ones(size(bw)); 

imshow(bw); 

N=1;% 这 里 假设 图 像 上 有 一 条 主要 直线 
for 1=1:N 





% 这 里 假定 图 像 上 有 N 条 主要 直线 
[yl,collj=max(ruthta); 
[y2,row |2-max(y 1); 
% 求 出 hough 变换 最 大 值 的 坐标 
col-coll(row); 
ruthta(col,row)-0; 
% 为 了 避免 重复 计算 将 计算 过 的 点 置 为 0 
p-3; 
if col-p»0&col-p«md&row-p»0&row-p«ma 
rethta(col-p:col*p,row-p:row-p)-0; 
end 
nds-ruthx {col,row }; 
pline2-draw l(nds); 
end 
function pline-draw l(im) 
% 此 函数 实现 根据 在 一 条 直线 上 点 的 坐标 ， 计 算出 直线 参数 ， 并 男 出 直线 的 功能 。 
y-im(l,:); 
x-1m(2,:); 
mx-max(x);nx-min(x); 
% 人 确定 直线 在 x 方 同 的 范围 
my=max(y);ny=min(y); 
% 确 定 和 直线 在 y 方 同 的 范围 
cx-mean(x);cy-mean(y); 
% 计 算出 直线 的 中 心 点 坐标 
XX—X-CX;yy—y-Cy; 
a-sum(xx.^2)-sum(xx)^2; 
b-sum(xx.*yy)-sum(xx)*sum(yy); 
c-sum(yy.^2)-sum(yy)^2; 
Vs-(a*tc)/2-*sqrt((a-c)^2/44-b^2); 
% 利 用 最 小 二 乘 拟 合 直线 ， 求 出 与 直线 有 天 的 Vs 
if abs((Vs-ay(b*eps))--1 
my-floor(cy--(Vs-a)/(b*eps)*(mx-cx)); 
ny-floor(cy--«(Vs-a)/(b-eps)*(nx-cx)); 
else 
mx-floor(cx-b/(Vs-a-*eps)*(my-cy)); 
nx-floor(ex--b/(Vs-a-teps)*(ny-cy)); 
end 
% 为 避免 斜率 大 于 1 时 计算 端点 坐标 误差 过 大 ， 根 据 和 斜率 值 确定 最 大 的 x 坐标 或 者 y 坐标 
line([nx,mx ],[ny,my ); 


% 画 出 直线 
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. d ' Y]. 
pline -[[nx,ny] |[mx,my] IF 
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同时 ， 在 MATLAB 数字 疼 像 处 理工 具 箱 中 ， 也 提供 了 与 Hough 变换 相关 的 函数 ， 现 将 
其 介绍 如 下 : 
[H, theta, rho] = hough(bw)。 
功能 : 对 所 输入 的 二 值 图 像 进 行 Hough 变换 。 
peaks = houghpeaks(H,numpeaks) 


功能 : TAE ELS ES RIIIE EREM AEE H P RE - 
通过 例 程 2-39 对 上 面 两 个 函数 进一步 进行 讲解 ， 其 运行 结束 如 图 2-55 所 示 。 
例 程 2-39 
% 霍 夫 变 换 程序 
% 读 入 一 幅 真 彩 图 像 ， 将 其 放 入 一 个 名 为 RGB 的 数组 ; 
RGB = imread('road.jpg'); 
figure 
imshow(RGB) 
% 将 谈 入 的 真 彩 图 像 转换 为 灰 度 图 像 ， 将 该 灰 度 图 像 放 在 一 个 名 为 工 的 怎 阵 中 
I= rgb2gray(RGB); 
% 采用 canny 算 子 对 图 像 进行 边缘 检测 ; 
BW =edge(L canny ); 
% 对 存储 于 BW 数组 中 的 二 值 图 像 进 行 霍 夫 变换 ， 将 堆 夫 变换 后 的 绪 采 放 在 一 个 名 为 再 AR 
矩阵 中 ， 该 窍 阵 中 含有 size(T)*size(R)" i728, E T 中 是 Theta WA, R 是 RHO % 的 
IH EREKTA AHI RHO 轴 和 THETA 轴 的 最 小 单位 为 0.75; 
[H,T,R] = hough(BW,'RhoResolution',0.75," ThetaResolution',0.75); 
imshow(imadjust(mat2gray(H)),'XData', T, Y Data',R,... 
'InitialMagnification','fit)); 
xlabel(^theta"), ylabel( rho; 


axis on, axis normal, hold on; 














colormap(hot); 

% 显 示 峰 值 昧 加 器 的 位 置 〈《 取 累加 器 中 数值 最 大 的 4 个 ) 

P = houghpeaks(H,4) 

9o P. C22 表示 了 所 有 行 的 第 二 列 元 素 ; 

x= T(PC,2); y= R(P(G1)) 

% 将 峰值 点 在 霍 夫 空间 画 出 。 

plot(x,v,'s','color',"white"); 

K KK K K K K K K K K K K K K K K K K K K K K K K K FK K K K K K K FK K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK K FK FK K K K FK K FK K K K K K 











融会 贯通 : 基于 Hough 变换 检测 圆 





Hough 变换 的 基本 原理 在 于 ， 利 用 点 与 线 的 对 偶 性 ， 将 图 像 空间 的 线条 变 为 参数 空间 的 
聚集 点 ， 从 而 检测 给 定 图 像 是 否 存在 给 定性 质 的 曲线 。Hough 变换 的 主要 优点 是 受 共 线 点 的 
间 除 和 噪声 影响 较 小 。 因 此 ， 其 思想 可 以 推广 到 检测 曲线 ， 如 对 圆 的 检测 ， 其 参数 空间 增加 
到 三 维 ， 即 圆 的 方程 为 (x-a)* ^ (y- by ==， 通过 Hough 变换 ， 将 图 像 空间 Qc y) 对 应 到 
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参数 空间 (a, br) o 
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图 2-55 WIFE 2-39 的 运行 结 





基于 Hough 变换 检测 圆 的 基本 思想 是 : 对 参数 空间 适当 量化 ， 得 到 一 个 三 维 的 累加 器 
阵列 ， 并 计算 图 像 每 点 强度 的 梯度 信息 得 到 边缘 ， 再 计算 与 边缘 上 的 每 一 个 像素 (x ,”) 距离 
半径 为 r 的 所 有 点 ， 同 时 将 相应 立方 小 格 的 累加 右 加 1。 当 检测 完毕 后 ， 对 三 维 阵 列 的 所 有 
累加 器 求 峰值 ， 大 于 所 设 定 阔 值 的 峰值 小 格 的 坐标 就 对 应 看 图 像 空 间 圆 形 边界 的 圆心 。 
例 程 2-40 为 基于 Hough 变换 检测 圆 的 MATLAB 源 程序 。 

例 程 2-40 
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function [hough space,hough circle,para|] = hough circle(BW,step r,step angleTr min,r max,p) 
% 功能 :基于 Hough 变换 检测 

% 输入 : 

% BW- 二 值 图 像 ; 

% step_T- 检 测 的 圆 半径 步 长 

% step_angle- 角 上 度 步 长 ， 单 位 为 踊 度 

Vor min- 最 小 圆 半 径 

Vor max- 最 大 圆 半 径 

% p- 以 pxhough_space HEERE, p 取 0，1 之 间 的 数 

% 输出 : 

% hough space-Z Z^ [H], h(ajb,r) o AOE (a,b) FEN r 的 加 上 的 点 数 
% hough_circl- 二 值 图 像 ， 检 测 到 的 

% para- 检 测 到 的 圆 的 圆心 、 半 径 














[m,n] = size(BW); 
size r-round((r max-r min)/step r)-1; 


size angle = round(2*pi/step angle); 


hough space = zeros(m,n,size r); 
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[rows,cols] = find(BW); 
ecount — size(rows); 


% Hough 变换 
% 将 图 像 空 间 (x,y) 对 应 到 参数 空间 (a,b,r) > 
yo a = x-r*cos(angle) 
% b = y-r*sin(angle) 
for 二 1:ecount 
for r-l:size r 
for k=1:size angle 
a = round(rows(1)-(r min-(r-1)*step r)*cos(k*step angle)); 
b = round(cols(1)-(r min-(r-1)*step r)*sin(k*step angle)); 
if(a>0&a<=m&b>0&b<=n) 
hough space(a,b,r) = hough space(a,b,r)*1; 
end 
end 
end 
end 


% RREI ERRA 
max para = max(max(max(hough space))); 
index = find(hough space>=max para*p); 
length = size(index); 
hough circle-zeros(m,n); 
for i-1:ecount 
for k-1:length 
par3 = floor(index(k)/(m*n))71; 
par2 = floor((index(k)-(par3-1)*(m*n))/m)*1; 
parl — index(k)-(par3-1)*(m*n)-(par2-1)*m; 
if((rows(1)-par1)^24(cols(1)-par2)^2«(r min-(par3-1)*step r)^245&... 
(rows(1)-parl)^24(cols(i)-par2)^2»(r min-(par3-1)*step r)^2-5) 
hough circle(rows(1),cols(1)) = 1; 
end 
end 
end 


% 打印 结果 

for k-1:length 
par3 = floor(index(k)/(m*n))71; 
par2 = floor((index(k)-(par3-1)*(m*n))/m)*1; 
parl = index(k)-(par3-1)*(m*n)-(par2-1)*m; 
par3 =r min-(par3-l)*step r; 
fprintf( 1,'Center 9od %d radius %d\n',par1,par2,par3); 
para(:,k) = [parl ,par2,par3]; 

end 

KOK K K K K K K K K K K K K K K K K K K FK K K FK K K FK K K FK K K 3K K K FK K K FK K K FK K K FK K K FK K K FK FK K FK K K 3K FK K FK K ÞK FK FK K 3K K K 


在 MATLAB 中 输入 如 下 命令 段 ， 可 以 得 到 如 图 2-56 所 示 的 结 











^ MATLAB 5:24:35 





clc,clear all 


I = imread('circle.jpg"); 
[m,nJl] = size(I); 
if I1 
I = rgb2gray(I); 
end 
BW = edge(I,'sobel"); 
step r= l; 
step_angle = 0.1; 
minr = 20; 
maxr = 30; 
thresh = 0.7; 
[hough space,hough circle,para] = hough circle(BW,step_r,step_angle,minr,maxr,thresh); 


subplot(221),imshow(]),title(' 原 图 ") 
subplot(222),imshow(BW ,title(' 边 缘 ') 
subplot(223),imshow(hough circle),title《' 检 测 结果 '") 





图 2-56 ”程序 2-40 的 运行 结 


pm cn tac lt mcs 


i 经 验 分 享 : 如 何 对 Hough 变换 进行 改进 ， 以 提高 其 检测 速度 : 
| Hough 变换 是 一 种 全 局 转换 ， 其 实质 是 对 图 像 进 行 坐标 变换 将 图 像 空间 的 点 映 | 
i 射 到 参数 空 间 。 


> 


针对 Hough 变换 存在 的 运算 量 过 大 、 内 存 占用 多 的 缺 挟 ， 从 时 频 域 和 空间 域 两 个 角 瞩 
提出 了 一 种 改进 的 直线 快速 检测 方法 。 如 图 2-57 所 示 ， 该 算法 主要 包括 小 波 提升 、 二 值 化 
和 采用 改进 型 Hough 变换 提取 直线 参数 三 个 步 又 。 小 波 提 升 主要 是 用 于 提取 图 像 低 频 轮廓 信 
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恩 、 抑 制 融 频 噪声 ， 然 后 ， 对 像 双 降低 后 的 图 像 采 用 微分 算 子 进行 二 值 化 处 理 ， 再 次 ， 基 于 
“两 点 确定 一 条 直线 ”以 及 Hough 变换 过 程 中 “图 像 空 间 中 同一 直线 上 的 多 个 点 对 应 参数 空 
间 中 一 个 点 ”的 原理 ， 对 Hough 变换 进行 了 改进 。 将 二 值 化 后 图 像 空 间 中 的 非 和 零点 映 财 到 参 

















数 空间 中 具有 较 大 存在 概率 的 单元 ， 而 不 是 所 有 可 能 的 单元 。 D 
改进 型 直线 快速 检测 算法 
T RR /” 、、\、、 7N 空间 域 变换 `, 
BAR I — \ / \ 输 出 直线 参数 
E 步骤 1 Y 3 : 步骤 3 : 
小 波 提升 ， 改进 型 Hough 变 换 人 





M r M ^ 


E 提高 实时 性 、 减 少 内存 3 


图 2-57 ”改进 型 直线 检测 算法 步骤 示 意 





2.7 图 像 的 Walsh-Hadamard 变换 


离散 傅 里 叶 变 换 和 余弦 变换 在 快速 算法 中 都 要 用 到 复数 乘法 ， 占 用 的 时 间 仍 然 比 较 多 ， 
在 某 些 领域 中 ， 则 需要 更 为 便利 的 有 效 变 换 方法 。 为 此 ， 本 市 将 介绍 Walsh-Hadamard 变换 
(WHT). 

Walsh 变换 是 由 两 个 数值 ( 即 +1 和 -1) 作为 基本 函数 的 级 数 展开 而 成 的 ， 它 满足 完备 正 
区 性 。 由 于 Walsh 疯 数 是 二 值 正 交 函数 ， 与 数字 好 辑 中 的 两 个 状态 对 应 ， 因 此 更 适合 用 于 计 
算 机 技术 、 数 字 信 号 处 理 等 领域 。 

Walsh 函数 是 在 1923 年 由 美国 数学 家 Walsh 提出 的 ， 其 论文 中 给 出 了 Walsh 函数 的 递 推 
公式 ， 后 来 由 法 国 数学 家 Hadamard 等 利用 只 包含 +1 和 -1 阵 元 的 正 交 和 窍 阵 来 表示 Walsh K 
数 ， 所 以 Walsh 函数 与 Hadamard 变换 是 等 价 的 。 与 傅 里 时 变换 相 比 ，Walsh-Hadamard 变换 
的 主要 优点 在 于 存储 空间 少 和 运算 速度 高 ， 这 一 点 对 于 图 像 处 理 来 说 至 关 重 要 ， 特 别 是 在 大 
量 数据 需要 进行 实时 处 理 时 ，Walsh 函数 就 更 能 显示 出 它 的 优越 性 。 


"NA VValsh-Hadamard 变换 的 基本 原理 


Walsh-Hadamard 变换 在 岁 像 数据 压缩 、 滤 波 、 编 码 中 有 广泛 的 应 用 ， 它 可 用 于 硬件 实 
现 ， 容 易 模 拟 但 很 难 分 析 ; 它 具 有 无 乘积 计算 ， 有 快速 运算 算法 ， 还 可 由 递 推 矩阵 求 得 
Hadamard 矩阵 等 特点 。 

(1) Walsh 函数 

Walsh-Hadamard 变换 的 变换 核 是 一 类 非 正弦 的 正 交 函数 (Walsh 函数 )， 例 如 方 波 或 矩 
形 波 。 与 正弦 波 频 率 相 对 应 ， 这 种 非 正弦 波形 可 用 “ 列 率 ”( 单 位 时 间 内 波形 通过 宕 点 数 平 
均值 的 一 半 ) Hi. Walsh 子 数 可 以 由 Rademacher KAOH. Rademacher 困 数 集 是 一 个 不 
完备 的 正 交 函数 集 ，Rademacher KABANA ZE n Mt, H ROSE) 表示 。 




































































^ MATLAB s: 


R(n,t) = Sgn(sin2" nt) 
Rademacher 函数 波形 图 和 和 矩阵 表示 : 
ROD] [1.1 1 1 1 1 


R(Q, j |1 1 1 1 -1 -1 -l 


RQ,O| |1 1 -1 -1 1 1 -l 


RGD I1 -1 1 -1 1 e 
用 Rademacher 函数 构造 Walsh AŽ: 


p-1l 
Walsh(i,t) - | | | R(k + Lo 
k=0 


HEP, p 表示 i 所 选用 的 二 进 制 位 数 R(k+1,71) 是 Rademacher 函数 ; 
(i ) 是 i 的 自然 二 进 制 的 位 序 反 写 后 的 第 位 数字 ，i e {1,0}。 


Walsh 函数 的 矩阵 形式 : 


E 
II 
m Ó m Ó p mÓ p mÓ 


HE MIZIE PETEK CEFR): 


" 1 1 
i =] 
H,-H,GH, 


(2) Walsh-Hadamard 4515 zE Y. 
函数 f (£) 的 一 维 离散 Walsh 变换 为 : 


W(i) = lY f (tWalsh(,t) 














X20 CuEJSEC EX 





AB, OxizN-I. Walsh(t) 为 沃 尔 什 函数 ， 又 被 称 为 沃 尔 什 变 换 核 ，N 为 采样 
扩 数 。 
HERMAN: 


f() = Y WGWalsh(, t D 


HrBOEcKEEN-IH« 
一 维 离散 沃 尔 什 变换 可 表示 成 如 下 和 矩阵 形式 。 





W0) sO 
W(l l 
O [pq 各 
W(N —1) f(N - 1) 
P, Hy N N 阶 哈达 玛 矩 阵 。 
其 逆 变 换 为 
sO) W0) 


O gy WO 


f (N -1) W(N —1) 
KA f£ (x, 7 的 二 维 离散 Walsh-Hadamard 变换 为 


] 
W.(u,v)- N.N, Pod O HH, 


HERRN: 
f Go y) = HW. (u,v)H,,, 
由 定义 可 知 W (u,v) 可 以 从 计算 到 (u,v) 的 每 一 行 的 Walsh-Hadamard 变换 得 到 ， 结 果 产 
E N.N, 个 系数 ; 
W (0,0) W (0,1) Be W. (0,N, —1) 


W. (1,0 WD) .. W.(N,-1 
mig ,CD (N, -1) 


W.(N,-10) W,(N,-L1) .. W,(N,-LN, -1) 

二 维 Walsh-Hadamard 变换 可 由 以 下 两 种 方法 进行 计算 。 

方法 一 : 二 维 Walsh-Hadamard 变换 可 以 通过 一 维 Walsh-Hadamard 变换 计算 得 到 ， 步 又 
如 下 。 

D EN 2 N,, X fon y) PN, IPBES IER, ISI. (Qu, y) 。 

2) AN=N,; X W (u, y) 中 WN, 行 中 的 每 一 行 作 变换 ， 得 到 二 维 变换 系数 W (u,v) o 

方法 二 : 将 二 维 Walsh-Hadamard 变换 当做 一 维 来 计算 ， 这 种 方法 将 数据 矩阵 f(x,y) 的 
列 顺序 排列 ， 这 样 吏 形 成 了 NON, 个 元 素 的 列 窍 阵 。 然 后 按照 一 维 Walsh-Hadamard 变换 方法 
来 计算 。 
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0110 
p 0110|、 o 
XT FRIERE f(x, y) = —— 进行 二 维 Walsh-Hadamard 变换 的 过 程 如 下 。 
0110 
[w] - Lf ]L A6] L8] 
1 1 1 1]011:0] 1 1 1][20 0 2 
oli =a o: -llo110l1 -1 1 a| |0 0 0 o 
. 4] 1 -1-1/0 1 1 oli 1 a al |00 0 o0 
1 -1 -1 1/011 01 -1 -1 1ı| 000 0 
另外 有 
1 111 
zs. 1 1 ote | 
1 11 I 0 
1 11 1 


REA 例 程 精 讲 | 


例 程 2-41 是 实现 二 维 数组 的 快速 Walsh-Hadamard 变换 了 的 MATLAB 产程 序 。 
例 程 2-41 


LEERELLELLELLLLLLLLLLLLLLELLELLELLLLLLLLLLLLLLELLELLLLLLLLLLLLLLLLLLLLLLLLLELE 


function xx-fwhtdya2d(data2) 

% 功能 : 实现 二 维 数组 的 快速 Walsh-Hadamard 变换 ; 

Vo 输入 : data2- 符 变换 的 二 维 数组 ( 注 : 该 数组 的 行 数 和 列 数 为 2 的 倍数 ); 
xx- 快 速 Walsh-Hadamard 变换 后 的 结果 。 

xx=data2; 

N=length(xx); 

% XJIAREEBJARE—11 XETI ERE Walsh-Hadamard 变换 





for 1=1:N 
XX1(:)=fwhtdyald(Xx(1:)); 
end 


xx=zeros(N); 

% 对 变换 后 矩阵 的 每 一 列 进行 一 维 快速 Walsh-Hadamard 变换 
for J=1:N 

xx(:,])=fwhtdyald(xx1(:,])'); 

end 


% T BRA 

function x-fwhtdyald(datal) 

% 功能 : 实现 一 维 数组 的 快速 Walsh-Hadamard 变换 ; 

Vo 输入 : datal- 符 变换 的 一 维 数组 ( 注 : 该 数组 中 元 素 的 个 数 为 2 的 倍数 ); 
x- 快 速 Walsh-Hadamard 变换 后 的 结果 。 
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N-length(datal); 
x—bitrevorder(datal); 


L-log2(N); 
k1-N;k2-1;k3-N/2; > 
% 投 照 定义 ， 进 行 循环 
for 11=1:L 
Ll-l 
for 12-1:k2 
for 13=1:k3 
1=13+L1-1;]=1+k3; 
templ-x(1); temp2-x(]); 
x(1)-templ -temp2; 
x(])-templ -temp2; 
end 
L1=L1+k1; 
end 
k1=k1/2; k2=k2*2; k3-k3/2; 
end 
x=inv(N)*x; 
KK K K K K K K K K K FK K K FK K K FK K K FK K K FK K K FK K K FK K K FK FK K FK K K FK FK K FK K K FK K K FK FK K FK FK K FK K K FK FK K FK FK K FK FK K K K K 3K 





PARE Walsh-Hadamard 变换 在 图 像 讨 缩 领 域 的 应 用 


Walsh-Hadamard 变换 是 实时 的 、 对 称 的 正 交 变换 。 因 为 该 变换 只 包括 加 、 减 ， 没 有 任 
何 乘 、 除 运算 ， 所 以 有 快速 算法 。Walsh-Hadamard 变换 在 图 像 处 理 中 的 主要 应 用 是 压缩 编 
他。 下 面 用 一 个 图 像 压 缩 的 例子 来 讲述 MATLAB 如 何 实 现 Walsh-Hadamard 变换 。 

将 图 像 分 割 为 奋 干 16x16 的 子 图 像 块 后 ， 每 个 子 图 像 块 经 过 变换 将 有 很 多 系数 。 投 照 每 
个 系数 的 方差 来 排序 。 保 留 方差 较 大 的 系数 ， 含 弃 方 差 较 小 的 系数 。 所 用 程序 如 例 程 2-42 
所 示 ， 其 运行 结 未 如 岁 2-58 所 示 。 

例 程 2-42 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K FK K K K K K K ÞK ÞK K FK FK FK FK FK FK K K K K K K K 





























I=imread('jiangnan.jpg'); 

% 载 入 原始 图 像 

sig-rgb2gray(l); 

% 归 一 化 图 像 

sig-double(sig)/255; 

% 显 示 图 像 

figure,imshow(sig); 

% 求 出 图 像 大 小 

[m sig,n sig]|-size(sig); 

% 给 出 图 像 分 块 尺寸 和 保留 系数 的 个 数 
sizi=l6; 

Snum=128; 

% 分 块 和 进行 Walsh-Hadamard 变换 
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T-hadamard(sizi); 

hdcoe-blkproc(sig,[sizi sizi |,'P1*x*P2' T, T); 
% 重 新 排列 系数 

coe-im2col(hdcoe,[sizi sizi |,'distinct'); 

coe temp-coe; 

| Y,Ind |-sort(coe); 

vei E BH BUhNZT 2E ZA 


[m,n |-size(coe); 





Snum-m-Snum; 

for 二 1:n 

coe temp(Ind(1:Snum),1)-0; 

end 

% 重建 图 像 

re hdcoe-col2im(coe temp,[sizi sizi],[m sign sig],'distinct'); 
re sig-blkproc(re hdcoe,;[sizi sizi],'P1*x*P2'; T, T); 

Vo NEZIN E E] 

figureiimshow(uint8(re sig)); 

% 计 算 归 一 化 图 像 的 均 方 误差 


error-sig.^2-re sig.^2; 


MSE-sum(error(:)/prod(size(re sig))) 


KK K K K K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK ÞK K K K K FK K K K K K K ÞK ÞK K FK FK FK FK FK FK K K K K K K FK 





图 2-58 WIJE 2 的 运行 结果 
a) 原始 图 像 b) 压缩 后 的 图 像 


2.8 图 像 的 K-L 变换 


在 模式 识别 和 网 像 处 理 中 一 个 主要 的 问题 就 是 降 维 ， 在 实际 的 模 陈 识别 问题 中 ， 选 择 的 
特征 经 党 彼此 相关 ， 在 识别 这 些 特征 时 ， 大 部 分 都 古 无 用 的 。 如 果 能 减少 特征 的 数量 ， 即 减 
少 特征 空间 的 维 数 ， 就 能 以 更 少 的 存储 和 计算 复杂 度 获 得 更 好 的 准确 性 。 

如 何 寻找 一 种 合理 的 综合 性 方法 ， 可 以 满足 减少 特征 量 的 个 数 、 尽 量 不 损失 或 者 少 损失 
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原始 信息 ， 使 得 原本 相关 的 特征 转化 为 彼此 不 相关 《用 相关 系数 阵 衡 量 ) 这 3 个 要 求 呢 ? K- 
L (Karhunen-Loeve) 变换 就 可 以 人 简化 大 维 数 的 数据 集合 。 它 还 可 以 用 于 许多 图 像 的 处 理应 
用 中 ， 如 压缩 、 分 类 、 特 征 选择 等 。 
K-L 变换 也 称 为 特征 问 量 变换 、 主 分 量变 换 或 堆 特 林 〈Hotelling) 变换 ， 它 是 完全 从 图 D 
像 的 统计 性 质 出 发 实现 的 变换 。 
在 获取 、 通 过 通信 信道 传输 任何 一 幅 图 像 时 ， 总 是 混杂 有 许多 随机 干扰 因素 ， 实 际 获 得 
的 大 部 分 图 像 都 含有 随机 的 性 质 ， 称 其 为 随机 图 像 。K-L 变换 正 是 针对 这 类 广泛 的 随机 图 像 
提出 来 的 ， 当 对 图 像 施加 了 K-L 变换 后 ， 由 变换 结果 而 恢复 的 图 像 将 是 原 图 像 在 统计 意义 上 
IJ e EXEAT e 


ZEN K-L 变换 的 基本 原理 

Wx-[xx,-xy] 是 一 个 N 维 随机 矢量 ， 其 各 分 量 的 二 阶 矩 存在 ， 进 一 步 假设 得 到 了 M 
个 矢量 采样 x ,x,,…,xwy 。 在 实际 应 用 中 ， 可 将 图 像 看 成 随机 矢量 。 

例如 ， 有 具有 个 像素 的 图 像 f(1m,n) 在 某 个 通信 信道 传输 了 NWN 次 ， 由 于 受到 随机 干扰 ， 接 
收 到 的 是 一 个 图 像样 本 集合 {fi (n,n), fa m,n) f (m,n)| 。 对 第 i 次 获得 的 图 像 f, (m,n) ， 
可 用 一 个 YX 维 随机 列 矢量 交 表示 ， 从 而 图 像样 本 集合 可 表示 为 {x zx 

再 例如 ， 遥 感 多 光谱 图 像 的 原始 数据 可 用 矩阵 形式 表示 为 

















Xl %2 Xim 
y= X21 X» Xm 
Xni YN2 `U XNm 








式 中 ,NN 表示 波段 数 ，M RRRA FRIIDA AERE X HARE A 
ER. AREE X PE i 个 列 矢量 可 看 成 N 伪 随 机 列 矢 量 的 样本 ， 记 为 x, NAMERE X 可 表示 
N [XX Xy] o 

对 于 N 维 随机 列 矢 量 x=[xx,…xw] ， 其 均值 天 量 与 协 方差 矩阵 可 定义 为 

m. = E|X | 














C. -[c;]y.y = Ex - m, x —m,) ] 

AP, C Æ NxN 的 实 对 称 窍 阵 ， 其 对 角 线 元 取 c; 为 x WTA, c 2 x, 43 x, ZL IIT] 
HAZ, #H cj =cr。 进 一 步 ， 可 以 证 明 C, 是 半 正 定 的 ， 即 对 于 任意 的 N 维 列 天 量 
y-Dnxycysl» Hy €,»20. 

EXEM, m, 与 C, 可 通过 样本 x ,2 来 估计 ， 即 


1 M 
m . "Wim 
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由 于 C, 是 半 正 定 的， 根据 线性 代数 的 知识 可 知 ， 存 在 正 交 和 矩 阵 U= [uu,…uw] ， 使 











C, 对 角 化 ， 即 
UU=UU =I 
A 0 0 
U'CU -= : 
0 0 2 
; u; AC, 


AP, T 为 单位 矩阵 ，4 ,和 和 为 C 的 特征 根 ， 且 4 Ae 


的 与 和 1 对 应 的 归 一 化 特征 天 量 ， 即 
(4; I - C, )u; = 0 


随机 列 矢量 x=[ x] 的 KK-L 变换 定义 为 
y-U'(x-m,) (2-31) 
其 反 变 换 为 
x=Uy+m, ap 
对 于 遥感 多 光谱 图 像 ，K-L 变换 略 有 不 同 ， 即 
y-U'x (2-33) 
其 反 变 换 为 
x=Uy (2-34) 
(2-35) 


交感 多 光谱 图 像 的 K-L ERARA HARBEJES ER. Bl 


Y -[U' x U' x,--U'x,]- U' [x x,--x,]-U' X 
B — 分 量 、 sss 


s< BF 、 第 N 主 分 


Ab Ei (二 
小 能 量 信 I. 


U'X 的 第 一 主 分 量 包 含 了 的 绝 大 部 4 
KHR (2-731) 对 随机 列 矢 量 x=[xz…xzv] 进行 K-L 变换 ， 得 到 矢量 y。 容 易 验 证 y 





经 过 K-L 变换 后 ，U X 的 各 个 行 向 量 依次 称 为 第 一 主 分 量 





E 


里 。 





的 均值 天 量 m, SITZE C, 分 别 为 
m,= E|y|- 0 


C, = Ey - mXy-m,Y]- 
0 0 








C, 是 一 个 对 角 窍 阵 ， 主 对 角 线 的 元 素 束 是 C, 的 特征 值 ， 主 对 角 线 以 外 的 元 素 为 0， 从 
M y 的 各 分 量 之 间 是 不 相关 的 ， 也 就 是 ，K-L 变换 能 够 充分 去 除 相 关 性 。 由 于 4 也 是 C， 


的 特征 值 ， 所 以 C, 5; C, 具有 相同 的 特征 值 与 特征 天 量 。 





X20 CuEJSEC EX 








K-L 反 变 换 式 (2-320 可 以 精确 重建 x。 在 很 多 应 用 中 ， 取 了 的 前 K 个 分 量 ， 把 其 他 分 
量 置 为 0， 得 到 y-ln» yg 0-0] ， 用 y 来 近似 重建 x， 即 
X=Uy+m. = „u, +m 
Y X 2» u, X D 
也 束 是 ， 利 用 C, 中 与 玉 个 最 大 特征 值 对 应 的 天 个 特征 矢量 来 近似 重建 x。 
容易 验证 ， 计 是 x 的 无 偏 估计 ， 即 





ElX|= Y Ey ]u; +m, =m, 


i=l 
并 且 ， 久 与 了 之 间 误 差 能 量 〈 均 方 误差 ) 为 
o; = E(x- €) (x- $)] = 3 À, (2-36) 
j=K+1 

XX (2-36) WHH, WR K=N, BIURIH] C, 的 所 有 特征 天 量 来 重建 ， 则 两 者 之 间 的 均 方 误 
天 为 0， 可 得 到 精确 重建 。 由 于 是 单调 递减 的 ， 因 此 ， 可 以 根据 误 状 的 要 求 来 选取 特征 天 
量 的 个 数 K， 此 外 ， 通 过 选择 对 应 最 大 特征 值 的 个 特征 天 量 可 以 使 得 充 与 x 之 则 的 均 方 误 

天 达到 最 小 ， 即 K-L 释 换 是 在 均 方 误差 最 小 意义 下 的 最 优 和 变换 。 


2.8.2 例 程 精 讲 


例 程 2-43 是 对 图 像 进行 K-L 变换 的 过 程 ， 其 中 包括 3 个 子 程序 。 

例 程 2-43 
oaoa 
%%%%%%%%%% 主 程序 %%%%0%%%0%%%0%% 
f-imread('moon.jpg"); 
subplot(1,2,1),imshow(f); 

















title( 原始 图 像 ) 
% 对 多 波段 图 像 进 行 预 处 理 
X-row(ft); 


% 计 算 均 值 、 协 方差 、 特 征 值 、 特 征 问 量 
[Mx,Cx,L,A]-PCA(X); 

% 保 存 特征 值 、 特 征 向 量 文 件 
dimwrite('pcaL.text';L,'precision','96.6f ,newline' ,pc ); 
dlmwrite(PcaA.text,L,preclslon ,Yo.of ,newline' ,pc ); 
B-inv(A); 

r m-double(f(:,:,1)); 

g m-double(f(:,:,2)); 

b m-double(f(:,:,3)); 


% 得 到 第 一 主 成 分 、 第 二 主 成 分 、 第 三 主 成 分 
KL1-A(1,1)*r m+A(2,1)*g m-*A(3,1)*b m; 
KLl-uintS(KL 1); 








"s MATLAB 数字 图 像 处 理 实 上 





KL2-A(1,2)*r m*A(2,2)*g m+A(3,2)*b m; 
KL2-uintS(KL2); 


KL3-A(1,3)*r m-A(2,3)*g m-A(3,3)*b m; 
KL3-uint8(KL3); 


subplot(1,2,2);imshow(KL 1,[]); 
title(' 第 一 主 成 分 ") 


%%%%%%%%%% 子 程序 1%%%%%%%%%%%% 
function X-row(varargin) 
ADRE: 对 多 波段 进行 预 处 理 
orl=varargin{ 1}; 
[m,n]-size(ori(:,:,1)); 
iij-size(varargin {1 }); 
band=iii(3); 
if band—1 
error( 打 开 文 件 出 错 "); 
else 
X-zeros(band,m*n); 
for i-1:band 
a—ori(:,:,1); 
3 一 3 ; 
a-a(:)'; 
for j-1:m*n 
X(1)—a(1,j); 


%%%%%%%%%% 子 程序 2 9/09/09/09/09/09/09/09/09/09/09/09/0 
function [Mx,Cx,L,A|=PCA(a) 
% 功 能 :用 于 计算 均值 、 协 方差 、 特 征 值 、 特 征 问 量 
[m,n]-size(a); 
Mx-zeros(m,]1); 
Nx-zeros(m,); 
Cx-zeros(m,m); 
Cx=0; 
for i-1:m 

for j-1:n 

Mx(1,1)2Mx(1,1)*a(1,j); 

end 
end 
Mx=Mx/n:; 
for J=1:n 
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for i-1:m 
Nx(1,1)-a(1,]); 

end 

Cx-Cx-*(Nx-Mx)*((Nx-Mx)); 
end e 
Cx-Cx/n; 
[A;L]-eig(Cx); 
[A;L]-taxis( A,L); 


%%%%%%%%%% 子 程序 3 9/09/09/99/99/99/09/09/09/09/09/09/0 
function[A,L]=taxis(A,L) 
% 功 能 : 对 特征 同 量 、 特 征 值 进行 排序 
[m,n -size(L); 
for 171:m-1 
for J=1+1:m 
if L(,1)«L(.,j) 
temp-L/(1,); 
L(1,)-L6,); 
L(],))-temp; 
for j0—1:m 
temp0-A(]0,1); 
A()0,1)-A(0,]); 
A(]0,])-tempO0; 
end 
end 
end 
end 
L=L; 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK ÞK K K K K K K K K K K K ÞK K K K K K K K K K K K K ÞK K FK FK FK FK FK 3K 3K K K K 


例 程 运行 的 结果 如 图 2-59 所 示 。 


原始 图 像 第 一 主 成 分 





K| 2-59 WIFE 2-43 的 运行 结果 
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ET 
| 经 验 分 享 : 图 像 K-L 变换 的 主要 用 途 

K-L 变换 在 特征 向 量 上 展开 ， 能 够 最 大 限度 地 去 除 图 像 的 相关 性 ( 宛 余 度 ) ， 在 误差 所 
允许 的 范围 之 内 ， 实 现 最 小 均 方 误差 意义 上 的 压缩 ， 它 的 主要 用 途 包 括 : 

(1) 降 维 与 压缩 

K-L 变换 的 降 维 效果 是 十 分 明显 的 。 对 一 幅 人 脸 图 像 ， 如 果 它 由 M 行 与 W 列 像素 组 成 ， 
则 原始 的 特征 空间 维 数 就 应 为 MxN。 而 如 果 在 K-L 变换 只 用 到 30 个 基 ， 那 么 维 数 就 降 至 
30， 由 此 可 见 降 维 的 效果 是 极其 明显 的 。 另 一 方面 降 维 与 数据 压缩 又 是 紧密 联系 在 一 起 的 ， 
尤其 是 图 像 数 很 大 时 ， 压 缩 量 十 分 明显 。 

(2) 构造 参数 模型 

K-L 变换 不 仅仅 起 到 降 维 与 压缩 数据 的 作用 ， 更 重要 的 是 每 个 描述 量 都 有 明确 的 意义 ， 
因而 改变 某 一 个 参数 就 可 让 图 像 按 所 需要 的 方向 变化 。 在 没有 使 用 K-L 变换 的 原 数据 集中 对 
图 像 的 描述 量 是 每 个 像素 的 灰 度 值 ， 孤 立地 改变 某 个 像素 的 灰 度 值 是 没有 意义 的 。 而 在 使 用 
K-L 变换 后 ， 每 个 描述 量 都 有 其 各 自 的 作用 。 因 此 通过 改变 这 些 参 数 的 值 就 可 实现 对 模型 的 
有 效 描 述 ， 这 在 图 像 生 成 中 是 很 有 用 的 。 因 此 利用 K-L 变换 构造 出 可 控制 的 、 连 续 可 调 的 参 
数 模型 在 人 脸 识别 与 人 脸 图 像 重 构 采 方面 的 应 用 十 分 有 效 。 

(3) 人 脸 识别 

K-L 变换 是 著名 的 人 脸 识 别 方法 。 其 原理 十 分 简单 ， 首 先 搜集 要 识别 人 的 人 脸 图 像 ， 建 立 人 脸 
图 像 库 ， 然 后 利用 K-L 变换 确定 相应 的 人 脸 基 图 像 ， 再 反 过 来 用 这 些 基 图 像 对 人 脸 图 像 库 中 的 人 脸 
图 像 进 行 K-L 变换 ， 从 而 得 到 每 幅 图 像 的 参数 向 量 ， 并 将 每 幅 图 的 参数 向 量 存 起 来 。 在 识别 时 ， 先 
对 一 张 所 输入 的 脸 图 像 进行 必要 的 规范 化 ， 再 进行 KL 变换 分 析 ， 得 到 其 参数 向 量 。 将 这 个 参数 向 
量 与 库 中 每 幅 图 的 参数 向 量 进行 比较 ， 找 到 最 相似 的 参数 向 量 ， 也 就 等 于 找到 最 相似 的 人 脸 ， 从 而 认 
为 所 输入 的 人 脸 图 像 就 是 库 内 该 人 的 一 张 人 脸 ， 最 终 完成 识别 过 程 。 


2.9 ”基于 数学 形态 学 的 图 像 变换 





数学 形态 学 (Mathematics Morphology) 形成 于 1964 F, YE BS EZD MV ^f [bi HT 
(GMatheron) 和 他 的 学 生 赛 拉 〈J.Serra) TEM SETA FAI E RET EH T VASE. 
数学 形态 学 在 集合 代数 的 基础 上 通过 物体 和 结构 元 素 相 互 作 用 的 茶 些 运算 得 到 物体 更 本 质 的 
形态 〈Shape)， 是 用 集合 论 方法 定量 描述 目标 几何 结构 的 学 科 ， 其 基本 思想 和 方法 对 图 像 处 
理 的 理论 和 技术 产生 了 重大 的 影响 ， 已 成 为 数字 图 像 处 理 的 一 个 主要 研究 领域 ， 在 文字 识 
别 、 显 微 图 像 分 机 、 医 学 图 像 、 工 业 检 测 、 机 器 人 视觉 等 方面 都 有 很 成 功 的 应 用 。 

用 数学 形态 学 处 理 二 值 图 像 时 ， 要 设计 一 种 搜集 图 像 信 息 的 “ 探 针 ”， 称 为 结构 元 素 。 
结构 元 素 通 常 是 一 些小 的 简单 集合 ， 如 圆 形 、 正 方形 等 的 集合 。 观 察 者 在 图 像 中 不 断 地 移动 
结构 元 素 ， 看 是 人 奋 能 将 这 个 结构 元 素 很 好 地 填 放 在 图 像 的 内 部 ， 同 时 验证 填 放 结构 元 素 的 方 
法 是 耕 有 效 ， 并 对 图 像 内 适合 放 入 结构 元 素 的 位 置 做 标记 ， 从 而 得 到 关于 图 像 结构 的 信息 。 
这 些 信息 与 结构 元 素 的 太 寸 和 形状 都 有 关 。 构 造 不 同 的 络 构 元 系 《〈 如 方形 或 圆 形 结构 元 
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素 )， 便 可 完成 不 同 的 图 像 分 析 ， 从 而 得 到 不 同 的 分 析 结果 。 所 以 ， 从 某 种 意义 上 讲 ， 形 态 
学 图 像 是 以 几何 学 为 基础 的 ， 着 重 于 研究 图 像 的 几何 结构 。 
数学 形态 学 在 图 像 处 理 中 的 应 用 主要 是 :利用 形态 学 的 基本 运算 ， 对 图 像 进行 观察 和 处 
理 ， 从 而 达到 改善 图 像 质量 的 目的 ， 描 述 和 定义 图 像 的 各 种 几何 参数 和 特征 ， 如 面积 、 周 > 
长 、 联 通 度 、 颗 粒度 、 上 骨架 和 方向 性 。 























熟悉 数学 形态 学 的 基本 运算 








用 形态 学 的 方法 处 理 和 分 析 图 像 即 是 对 物体 或 目标 的 形态 分 析 ， 本 小 节 主 要 介绍 二 值 形 
态 分 析 方 法 中 最 基本 的 儿 种 运算 ， 即 腐蚀 、 脱 胀 以 及 由 它们 组 合 得 到 的 开 闭 运算 和 边界 检测 
算法 。 
昕 先 来 定义 一 些 基 本 运算 和 符号 。 
> 元 素 : KAME X, FA a 在 外 的 区 域 以 内 ， 则 称 a NX 的 元 素 ， 记 作 aEX， 
如 图 2-60 所 示 。 
> B 包含 于 X: 设 有 两 幅 图 像 B，X。 对 于 B 中 所 有 的 元 素 ai， 都 有 aiEX， 则 称 B 包 
F X, WEB CX, lk 2-61 所 示 。 


X X 
38 


图 2-60 JCK 图 2-61 包含 


> B 击 中 X: 设 有 两 幅 图 像 B，X。 大 存在 这 样 一 个 点 ， 它 既是 B 的 元 素 ， 又 是 X 的 元 
R. KBEF X. WEB tX, lk 2-62 Br. 

> B 不 击 中 X: Wai B, X. FATEMA, CBE B 的 元 素 ， 又 是 X 
的 元 素 ， 即 B 和 X 的 交集 是 空 ， 则 称 B 不 击 中 X， 记 作 BNX=@®; 其 中 门 是 集合 运 
算 相 交 的 符 吕 ， 中 表示 衬 集 ， 如 图 2-63 所 示 。 


图 2-62 击 中 图 2-63 不 击 中 


> 补 集 : KABES X, MA X 区 域 以 外 的 点 构成 的 集合 称 为 X 的 补 集 ， 记 作 XS, 
如 图 2-64 所 示 。 在 图 2-63 F, WA, WE BDmX=@， 
则 B Æ X 的 补 集 内 ， 即 B CX. 

> 结构 元 素 : KAWE B. X. Æ X 是 被 处 理 的 对 
象 ， 而 B 是 用 来 处 理 X 的 ， 则 称 B 为 结构 元 素 ， 又 
航 形 象 地 称 作 刷 和子。 结构 元 素 通 第 都 是 一 些 比 较 小 的 
图 像 。 

> 对 称 集 : UH dad B, X B 中 所 有 元 系 的 坐标 取 图 2-64 补 集 的 示意 图 
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Z WS, VERC =) MARERA RRRA B 的 对 称 集 ， 记 作 
B”, WB 2-65 所 示 。 

> ETE: 设 有 一 幅 图 像 B， 有 一 个 点 a (Koyo) ， 将 B 平移 a 后 的 结果 是 把 B 中 所 有 元 
素 的 横 坐 标 加 xz， 维 坐标 加 yo， 即 令 Cx, y) 变 成 (xtxo，y+tyo) ， 所 有 这 些 点 构成 
的 新 的 集合 称 为 B 的 平移 ， 记 作 Ba WEI 2-66 Jr. 


一 一 ü(Xo,yo) 
| 





图 2-65 ”对 称 集 的 示意 图 图 2-66 平移 的 示意 图 


以 上 介绍 了 这 么 多 基本 符号 和 关系 ， 现 在 来 应 用 这 些 符号 和 关系 ， 看 一 下 形态 学 的 基本 





i. 
(1) 腐蚀 

把 结构 元 素 B 平移 a 后 得 到 B, BEET X, RITAS a 点 ， 所 有 满足 上 述 条 件 
的 a 点 组 成 的 集合 称 作 X 被 B 腐蚀 的 结果 。 用 公式 表示 为 ECX)={a| B, C Xi-XQB, WE 2-67 
所 示 。 








X 


图 2-67 ”腐蚀 的 示意 图 


图 2-67 中 X 是 被 处 理 的 对 象 ，B 是 结构 元 素 。 不 难 知 道 ， 对 于 任 昌 一 个 在 阴影 部 分 的 
点 4q，Bs 包含 于 X, MA X B 腐蚀 的 结果 就 是 那个 阴影 部 分 。 阴 影 部 分 在 X 的 范围 之 
内 ， 且 比 X 小 ， 束 像 XX 被 剥 挥 了 一 层 ， 这 束 是 叫 腐 蚀 的 原因 。 

在 图 2-68 中 ， 左 边 是 被 处 理 的 图 像 X( 二 值 图 像 ， 此 处 针对 的 是 黑 点 ) ， 中 间 是 结构 
JIZ B， 那 个 标 有 origin 的 点 是 中 心 点 ， 即 当前 处 理 元 素 的 位 置 ， 在 介绍 模板 操作 时 也 有 过 
类 似 的 概念 。 腐 蚀 的 方法 是 ， 拿 B 的 中 心 点 和 X 上 的 点 一 个 一 个 地 进行 对 比 ， 如 果 B 上 的 
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HARRE X 的 范围 内 ， 则 该 点 保留 ， 耕 则 将 该 点 去 挥 ; 右边 是 腐蚀 后 的 结 末 。 可 以 看 出 ， 
它 仍 在 原来 X WWAN, HHE XERKA, mA X 被 褒 刨 挥 了 一 层 。 
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图 2-68 腐蚀 的 示意 图 
如 用 0 代表 背景 ，1 代表 目标 ， 设 数字 图 像 g9$ MAIR E N 


origin 


x 
O 
中 


"X 





= OO mL 


三 角形 “ 信 ” 代 表 坐 标 原点 ， 则 用 对 5 腐蚀 的 结果 为 
00000 
S =|0 01 00 
0.0 1 10 

(2) 膨胀 

膨胀 可 以 看 做 是 腐蚀 的 对 偶 运 算 ， 其 定义 是 : 把 结构 元 素 B 平移 a 后 得 到 Bao tr Bath 
中 X， 我 们 记 下 这 个 a 点 。 所 有 满足 上 述 条 件 的 


a 点 组 成 的 集合 称 作 和 被 B 鹏 胀 的 结果 。 用 公式 y 


表示 为 : DOO-[a|B, t Xi-X*9B, WKE 2-69 所 X 
示 。 图 2-69 F X 是 被 处 理 的 对 象 ，B 是 结构 元 
素 ， 不 难 知道 ， 对 于 任意 一 个 在 阴影 部 分 的 点 


a Batt X, FA X X B 膨胀 的 结果 就 是 那个 7 
































y 
阴影 部 分 。 阴 影 部 分 包括 X 的 所 有 范围 , 就 像 X ”gz 于 
膨胀 了 一 圈 ， 这 就 是 叫 膨胀 的 原因 。 
现在 来 看 看 实际 上 是 怎样 进行 膨胀 运算 2 Sy 
的 。 在 图 2-70 中 ， 左 边 是 被 处 理 的 图 像 X (二 TH 


值 图 像 ， 此 处 针对 的 是 黑 点 ) ， 中 间 是 结构 元 素 
B。 膨 胀 的 方法 是 ， 拿 B 的 中 心 点 和 X 上 的 点 及 B12-69 膨胀 的 示意 图 

X 周围 的 点 一 个 一 个 地 进行 比 对 ， 如 果 B 上 有 一 

个 点 落 在 X 的 范围 内 ， 则 该 点 就 为 黑 ， 右 边 是 膨胀 后 的 结果 。 可 以 看 出 ， 它 包括 X 的 所 有 
WE, WA XET- E. 
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图 2-70 ”膨胀 运算 


腐蚀 运算 和 膨胀 运算 互 为 对 偶 的 ， 用 公式 表示 为 (XB)=(X*GB)， 即 被 B 腐蚀 后 的 补 
集 等 于 对 的 补 集 被 B 膨胀 。 这 句 话 可 以 形象 地 理解 为 : 河岸 的 补 集 为 河面 ， 河 岸 的 腐蚀 等 价 
于 河面 的 膨胀 。 读 者 可 以 自己 举 个 例子 来 验证 一 下 这 个 关系 。 在 有 些 情况 下， 这 个 对 侦 关 系 
是 非 铅 有 用 的 。 例 如 ， 某 个 图 像 处 理 系统 用 便 件 实现 了 腐蚀 运算 ， 那 么 不 必 再 另 摘 一 僚 膀 胀 
的 硬件， 直接 利用 该 对 侦 就 可 以 实现 了 。 
例 程 2-44 说 明了 如 何 对 价 币 图 像 进行 腐蚀 和 膨胀 操作 ， 程 序 代码 如 下 。 其 运行 效果 
如 图 2-71 所 示 。 
例 程 2-44 
% 创 建 结 构 元 素 
SE=strel('rectangle',[40 30]); 
I-imread('eight.tif); 
subplot(131),imshow(L)title( Ji 4&5 E] f£); 
% 使 用 结构 元 素 腐 蚀 图 像 
I2-imerode(L SE); 
subplot(132),imshow(L2), title(' 腐 蚀 图 像 "); 
% 恢 复 矩 形 为 原 有 大 小 ， 使 用 相同 的 结构 元 素 对 腐蚀 过 的 图 像 进行 膨胀 
I3-imdilate(I2, S E); 
subplot(133),imshow(13), title HHK RMAN: 
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原始 图 像 腐蚀 图 像 EKER 
(3) FEA 


AERE IZKIRA, BI OPENCO=D(ECO)。 


图 2-71 WIFE 2-44 运行 效果 
现在 来 看 一 个 开 运 算 的 例子 〈 见 几 2-72). ÆR 2-72 上 和 面 的 两 幅 图 中 ， 左 边 是 被 处 理 
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的 图 像 X〈 二 值 图 像 ， 此 处 针对 的 是 黑 点 ) ， 右 边 是 结构 元 素 B， 下 面 的 两 幅 图 中 左边 是 腐 
EAER; 右边 是 在 此 基础 上 脱 胀 的 结果 。 可 以 看 到 ， 原 图 经 过 开 运 算 后 ， 一 些 孤 立 的 小 
点 被 去 挥 了 。 一 般 来 说 ， 开 运算 能 够 去 除 孤 立 的 小 点 、 毛 刺 和 小 桥 〈( 即 连通 两 块 区 域 的 小 














点 ) ， 而 总 的 位 置 和 形状 不 变 ， 这 就 是 开 运算 的 作用 。 © 
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图 2-72” 开 运算 
(4) 财运 算 
先 脱 胀 后 认 蚀 称 为 团 ， 即 CLOSECO=E(DCO)。 现 在 来 看 一 个 财运 算 的 例子 〈 见 图 2-735: 
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图 2-73” 闭 运算 








在 图 2-73 上 面 的 两 幅 图 中 ， 左 边 是 被 处 理 的 图 像 X〈 二 值 图 像 ， 此 处 针对 的 是 黑 
点 ) ， 右 边 是 结构 元 素 B， 下 面 的 两 幅 图 中 左边 是 膨胀 后 的 结果 ， 右 边 是 在 此 基础 上 腐蚀 的 
结果 。 可 以 看 到 ， 原 图 经 过 闭 运 算 后 ， 断 裂 的 地 方 被 弥合 了 。 一 般 来 说 ， 闭 运算 能 够 填 平 小 
孔 ， 浆 合 小 裂缝 ， 而 总 的 位 置 和 形状 不 变 。 这 就 是 闭 运算 的 作用 。 

开 和 闭 也 是 对 偶 运 算 。 用 公式 表示 为 (OPEN(X))c=CLOSE((X,))， 或 者 (CLOSE(X))。 
=OPEN((X.))。 即 X 开 运 算 的 补 集 等 于 X 的 补 集 的 财运 算 ， 或 者 X 财运 算 的 补 集 等 于 X 的 
补 集 的 开 运 算 。 这 人 句 话 可 以 这 样 来 理解 : 在 两 个 小 久之 则 有 一 座 小 桥 ， 可 以 把 岛 和 桥 看 做 是 
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处 理 对 象 X， 则 X 的 补 集 为 大 海 。 如 果 涨 潮 时 将 小 桥 和 岛 的 外 围 淹没 〈 相 当 于 用 尺寸 比 桥 帘 
大 的 结构 元 素 对 X 进行 开 运 算 )， 那 么 两 个 岛 的 分 隔 ， 相 当 于 小 桥 两 边 海域 的 连通 〈 对 XC TER 
闭 运 算 )。 
例 程 2-45 是 利用 MATLAB 实现 二 值 图 像 开 运算 和 团 运 算 的 程序 代码 ， 其 运行 结果 如 
图 2-74 所 示 。 
例 程 2-45 
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clear all; 

bwO-imread('eight.tif"); 

subplot(23 1),imshow(bw0),title(' Joi 25 E] ffe"); 
AEA RERA 0.7 的 二 值 图 像 
bwl-im2bw(bw0,0.7); 
subplot(232),imshow(bw 1 ),title( — f& E); 
% 用 三 阶 单位 矩阵 的 结构 元 系 进 行 开 远 算 


s-ones(3); 





bw2-imopen(bwl1,s); 
subplot(233),imshow(bw2),title( 用 三 阶 单位 矩阵 元 素 进 行 开 运算 ); 
% 用 三 阶 单位 矩阵 的 结构 元 素 进 行 闭 运 得 

bw3=imclose(bw1,s); 

subplot(234),imshow(bw3),title( H =I FAAEE REIR HT AEA; 
% 用 平坦 圆 盘 结构 元 素 进 行 开 运 算 

s]-strel('disk',2); 

bw4-imopen(bwl1,s1); 

subplot(235),imshow(bw4),title(' 用 圆 盘 结构 元 素 进 行 开 运 算 '"): 

% 用 平坦 圆 盘 结构 元 素 进 行 闭 运 算 

bw5-imclose(bw1,s1); 

subplot(236),imshow(bw5),title( Hl Ed t £5 P765 28 ETT His $1; 
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原始 图 像 用 三 阶 单位 矩阵 元 素 进 行 开 运 算 





用 三 阶 单位 矩阵 元 素 进 行 闭 运算 用 圆 盘 结 构 元 素 进 行 开 运算 用 圆 盘 结构 元 素 进 行 闭 运算 





图 2-74 WIFE 2-45 运行 结果 
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本 章 导 1 
所 谓 分 析 束 是 将 研究 对 象 的 整体 分 为 各 个 部 分 、 方 面 、 因 素 和 层次 ， 并 分 别 加 以 考 宗 的 
认识 活动 。 比 如 说 ， 研 究 植 物 细胞 ， 可 将 它 分 为 细胞 壁 、 细 胞 腊 、 细 胞 质 和 细胞 核 几 个 不 同 
部 分 来 认识 ， 并 分 别 考察 各 部 分 所 特有 的 性 质 和 功能 。 因 此 ， 在 研究 数字 图 像 时 ， 也 需要 将 
其 有 机 分 解 ， 分 门 别 类 地 进行 透析 。 
本 章 从 色彩 空间 、 克 上 度 统计 、 纹 理 特 征 、 序 列 相关 性 等 儿 个 方面 对 数字 图 像 及 视频 序列 
图 像 进 行 分 析 ， 并 给 出 了 评价 图 像 质 量 的 指标 和 方法 ， 编 写 思 路 如 图 3-1 所 示 。 


色彩 分 析 3.1 图 像 的 色彩 空间 
灰 度 分 析 3.2 图 像 的 直方 图 
3.3 图 像 的 纹理 特征 分 析 
纹理 分 析 
3.4 图 像 的 自 相关 函数 
相关 性 分 析 3.5 视频 图 像 分 析 与 处 理 


质量 评价 3.6 图 像 质量 的 评价 
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Mt 























图 3-1 第 3 章 的 编写 思路 
3.1 图 像 的 色彩 空间 


常见 的 色彩 空间 


为 了 用 计算 机 来 表示 和 处 理 闫 色 ， 必 须 采 用 定量 的 方法 来 描述 凑 色 ， 即 建立 颜色 模型 来 
文 持 数 字 图 像 的 生成 、 和 存储、 处 理 及 显示 。 为 了 方便 对 彩色 图 像 的 研究 ， 研 究 者 建立 了 多 种 
不 同色 彩 空间 对 应 的 不 同 处 理 和 转换 。 目 前 广泛 采用 的 颜色 模型 有 三 大 类 ， 即 计算 颜色 模 
型 、 工 业 闫 色 模 型 和 视觉 磊 色 模型 。 计 算 颜 色 模 型 又 称 为 色 度 学 闫 色 模 型 ， 主 要 应 用 于 纯 理 
论 研 究 和 计算 推导 ; 工业 颜色 模型 侧重 于 实际 的 实现 技术 ， 广 泛 应 用 于 计算 机 图 形 学 和 图 像 
处 理 中 ， 其 通常 来 用 RGB 基色 体系 。 

(1) RGB 色彩 空间 

美国 国家 电视 系统 委员 会 (NTSC) 为 显示 右上 显示 彩色 图 像 而 提出 的 RGB 彩色 系统 模 
型 是 最 重要 的 工业 颜色 模型 。RGB 彩色 系统 构成 了 一 个 三 维 的 彩色 空间 CR, G, B) 坐标 系 
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中 的 一 个 立方 体 。R、G、B 是 彩色 空间 的 三 个 坐标 轴 ， 每 个 坐标 都 量化 为 0 一 23$，0 对 应 最 
H. 255 对 应 最 完 。 这 样 所 有 的 颜色 都 将 位 于 一 个 边 长 为 256 的 立方 体内 。 彩 色 立 方 体 中 任 
意 一 点 都 对 应 一 种 颜色 ， 黑 色 C0, 0, 0) 位 于 坐标 系 原点 ， 其 中 OOXRE255, 0x:Gzx255, 
0xBx255, lll 3-2 Pros. 














B 





图 3-2 RGB 彩色 立方 体 


RGB 颜色 空间 是 图 像 处 理 中 最 基础 的 颜色 模型 ， 它 是 在 配色 实验 的 基础 上 建立 起 来 
的 ，RGB 颜色 空间 建立 的 主要 依据 是 人 的 眼睛 有 红 、 绿 、 赣 三 种 色 感 细胞 ， 它 们 的 最 大 感 
光 灵 人 敏 度 分 别 落 在 红色 、 蓝 色 和 绿色 区 域 ， 其 合成 的 光谱 响应 驶 是 视觉 昌 线 ， 由 此 推出 任何 
彩色 都 可 以 用 红 、 绿 、 蓝 三 种 基色 来 配置 。 

(2) HSV 色彩 空间 

如 图 3-3 所 示 ，HSV (Hue, Saturation, Value) 色彩 空间 的 模型 对 应 于 圆柱 坐标 系 中 的 
一 个 圆锥 形 子 集 ， 圆 锥 的 顶 面 对 应 于 大 1。 它 包含 RGB 模型 中 的 R—I. G—1. B—1 三 个 
面 ， 所 代表 的 颜色 较 亮 。 色 彩 H 由 绕 V 轴 的 旋转 角 给 定 。 红 色 对 应 于 角度 0”， 绿 色 对 应 于 
角度 120”， 蓝 色 对 应 于 角度 240”。 在 HSV 颜色 模型 中 ， 每 一 种 颜色 和 它 的 补 色 相 兰 180”。 
饱和 度 S 取 值 为 0 一 1， 所 以 圆锥 顶 面 的 半径 为 1。 在 圆锥 的 顶点 (原点 ) Ab. V-0, 万 和 SS 
无 定义 ， 代 表 黑 色 ， 圆 锥 的 顶 面 中 心 处 S—0, V—1. H 无 定义 ， 代 表白 色 ; 从 该 点 到 原点 
代表 亮度 渐 瞳 的 灰色 ， 即 具有 不 同 灰 度 的 灰色 。 对 于 这 些 点 ，S=0, H 的 值 无 定义 。 可 以 
说 ，HSV 模型 中 的 轴 对 应 于 RGB 颜色 空间 的 主 对 角 线 。 在 圆锥 顶 面 的 圆周 上 的 颜色 ， 
一 1，S 王 1， 这 种 颜色 是 纯色 。 

由 于 HSV 模型 可 以 只 用 反映 色彩 本 质 特 性 的 色 度 、 饱 和 度 来 进行 各 种 颜色 的 聚 类 ， 将 
亮度 信息 和 灰 度 信息 从 色彩 中 提取 出 去 ， 从 而 去 揉 光照 的 影响 ， 将 颜色 和 亮度 分 开 处 理 ， 使 
程序 具有 更 强 的 和 鲁 棒 性 ， 比 RGB 模型 具有 更 好 的 识别 效果 。 色 度 和 饱和 度 属 性 能 比较 准确 
地 反映 颜色 种 类 ， 对 外 界 光 照 条 件 的 变化 敏感 程度 低 。 
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图 3-3 HSV 彩色 立方 体 
HEM RGB 到 HSV 转换 为 非 线 性 变换 ， 其 转换 关系 如 下 。 


undefined if max-min 


$E A ene if max-r and gb 
E im EE. 

500 x +0 if max=r and g«b 
duc eo I 
60 x ————— +0 if max-g 


60°x— 82-0 ,0 if max=b 


max- min 
0 if max = 0 
5 =< max- min min 
= ~ =] otherwise 
max max 
v = max 








式 中 ，7,g,p 分 别 为 图 像 的 三 基色 的 灰 度 值 ， 忆 sy 分别 为 图 像 的 色 度 、 饱 和 度 、 亮 度 。 
(3) YUV 空间 
YUV 色彩 空间 利用 了 人 了 眼 对 亮度 信息 更 加 敏感 的 特点 ， 把 由 视觉 传 感 占 采集 得 到 的 彩 
色 图 像 信号 ， 经 分 色 后 分 别 放 大 校正 得 到 RGB 图 像 ， 再 经 过 和 矩阵 变换 电路 得 到 亮度 信号 Y 
和 两 个 色差 信号 B- 了 (Cb)、R-Y (Cr)， 最 后 发 送 问 将 亮度 和 色差 三 个 信号 分 别 进行 编码 ， 
用 同一 信道 发 送出 去 ， 用 公式 表示 如 下 : 
Y=K,R+K,G+K,B 
Cb=B-Y 
Cr=R-Y 
Cg-G-Y 
其 中 ，K 为 加 权 因 子 。 显 然 ，Cb+Cr+Cg = 常数， 因此 ， 只 要 知道 Co 、Cr 、 Cg 中 两 
项 即 可 。 因 此 ，RGB 空间 转换 为 YUV 空间 可 以 通过 下 面 的 公式 来 转换 。 
Y - KR - (I- K, — K,.)G  K,B 





























0.5 
qr um 
(1— K,)(B - Y) 

G 0.5 


 (I- K,XR- Y) 
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YUV 空间 到 RGB 空间 的 转换 公式 为 : 








LUE 

R-Y r 
*'05€r 

oy 2E-K) — 2K-K,) 
(IK. Kb qoE Re 
ER, 

BC SC 


其 中 ，K,=0.114; K,-0.299. 

YUV 空间 中 ， 常 用 的 格式 有 4:4:4,，4:2:2,4:2:0 等 。 以 4 :2 :2 格式 为 例 ， 
它 对 每 个 像素 的 亮度 (Y) 进行 采集 ， 而 对 色差 U M V 则 每 两 个 像素 采集 一 次 ， 其 在 内 存 中 
的 存放 格式 如 表 3-1 所 示 。 








表 3-1 YUV422 格式 在 内 存 中 的 形式 


16 位 地 址 D7-D0 K 8 f) 


(4) HSI 色彩 空间 
HSI i f&^* JA ABMS A. HME (Hue), f&U I BE (Saturation 或 
Chroma) 4z5HÉ CIntensity 或 Brightness) 来 描述 色彩 。HSI 颜色 衬 间 可 以 用 一 个 圆锥 空间 
模型 来 描述 。 
通 钊 把 色调 饱和 度 通 称 为 色 度 ， 用 来 表示 颜色 的 类 别 与 深浅 程度 。 由 于 人 的 视觉 对 亮度 
的 敏感 程度 远 强 于 对 颜色 浓淡 的 敏感 程度 ， 为 了 便于 色彩 处 理 和 识别 ， 人 的 视觉 系统 经 音 采 
用 HSI METH, EE RGB 颜色 空间 更 符合 人 的 视觉 特性 。 在 图 像 处 理 和 计算 机 视 党 中 ， 
大 量 算法 都 可 以 在 HSI 颜色 罕 间 中 方便 地 使 用 ， 由 于 HH. S 三 个 分 量 相互 独立 ， 可 以 将 它 
们 分 开 处 理 。 因 此 ， 使 用 HSI 颜色 衬 间 可 以 大 大 简化 图 像 分 析 和 处 理 的 工作 量 。 
RGB 色彩 空间 和 HSI 色彩 空间 可 以 相互 转换 。 假 设 R、G 和 B 分 别 代表 RGB Ate fh) 
的 三 个 分 量 ，HSI 空间 的 三 个 分 量 且 S$S 和 了 计算 如 下 。 
"» WR B<G 
|360 -9 如 果 B>G 


























S=1 [min(R, G, 5)] 


2 3 
R+G+B 


I- 10 G4 B) 


TI - G) «(QU - B] 


J( -GP «(8 - BX(G — B) 


其 中 ，0 = arccos 





43265 EEk 


(5) 灰 度 空间 
闫 色 可 分 为 黑白 色 和 彩色 。 黑 白色 指 不 包含 任何 的 彩色 成 分 ， 仪 由 黑色 和 白色 组 成 。 在 
RGB 颜色 模型 中 ， 如 果 R=G=B， 则 颜色 (R, G, B) 表示 一 种 黑白 颜色 ; 其 中 R=G=B 的 
值 叫 做 灰 度 值 ， 所 以 黑白 色 又 叫做 灰 度 颜色 。 彩 色 和 灰 度 之 间 可 以 互相 转化 ， 由 彩色 转化 为 
灰 度 的 过 程 叫 做 灰 度 化 处 理 。 
灰 度 化 就 是 使 彩色 的 R. G B 分 量 值 相等 的 过 程 。 由 于 R G B. 的 取 值 范围 是 0 一 
255， 所 以 灰 度 的 级 别 只 有 256 级 ， 即 灰 度 图 像 仅 能 表现 256 ME KRE). 
灰 度 化 处 理 的 方法 有 如 下 3 种 。 
> 最 大 值 法 : ER G B 的 值 等 于 3 值 中 最 大 的 一 个 。 最 大 法 会 形成 很 高 色 亮 度 
图 像 。 
> 平均 值 法 : 使 R、G、B 的 值 等 于 求 出 平均 值 。 平 均值 法 会 形成 较 和 柔和 的 灰 度 图 像 。 
> 加 权 平 均 法 : 根据 重要 性 或 其 他 指标 给 R G B 赋予 不 同 的 权 值 ， 并 使 R、G、B 
的 值 加 权 平 均 ， 即 




















R=G=B=(WrR+ WgG + WbB)/3 
其 中 ，WWr 、Weg 、Wb 分 别 为 R、G、B 的 权 值 。Wr- 、We 、Wb 取 不 同 的 值 ， 加 权 平 


均 法 就 将 形成 不 同 的 灰 度 图 像 。 由 于 人 有 眼 对 绿色 的 敏感 度 最 高 ， 红 色 次 之 ， 对 蓝 色 的 敏感 度 
最 低 ， 因 此 ， 使 所 > We > Wb 将 得 到 合理 的 灰 度 图 像 。 


BA nat | 


MATLAB 的 图 像 处 理工 具 箱 提供 了 将 RGB 模型 转换 为 HSV 模型 。 其 调用 格式 如 下 。 
Hsvmap-rgb2hsv(rgbmap) 
HSV —rgb2hsv(RGB) 

Hsvmap=rgb2hsv(rgbmap) 用 于 将 RGB 衬 间 的 色彩 表 rgbmap 转换 为 HSV ERE RIT 
EITE Hsvmap; HSV 二 rgb2hsv(RGB) 则 是 将 真 彩 图 像 RGB 转换 为 HSV 色彩 空间 。 

例 程 3-1 是 调用 上 述 函 数 将 一 幅 真 彩 图 像 转 换 为 一 个 HSV 颜色 空间 的 图 像 ， 其 运行 效 
果 如 图 3-4 所 示 。 

例 程 3-1 

















KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 
RGBa-imread('pic16.jpg"); 
HSV-rgb2hsv(RGB); 
subplot(121) 

% subimage(RGB); 
imshow(RGB) 

title'RGB 空间 图 像 ); 
subplot(122) 

% subimage(HS V); 
imshow(HSV) 

title(' 变 换 后 的 HSV 空间 图 像 ); 
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> 





RGB 空间 图 像 
"Ba | 





例 程 3-2 是 将 RGB 空间 转换 成 HS 空间 的 MATLAB 源 程 序 ， 其 运行 过 程 如 图 3-5a 所 


未 ， 运 行 结果 如 图 3-5c 所 示 。 
例 程 3-2 
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3-4 WFE 3-1 的 运行 结果 


变换 后 的 HSV 空 间 图 像 
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function hsi-rgb2hsi(rgb) 


% 功能 : 从 RGB 空间 转换 到 HSI 空间 
% 提取 RGB 颜色 空间 中 的 每 一 个 分 量 





rgb-im2double(rgb); 


r—-rgb(:,:,1);g-rgb(:,:,;2);b-rgb(:,:,3); 


% 实现 转换 操作 
num=0.5*((r-g)+(r-b)); 


den=sqrt((r-g).*(r-g)+(r-b).*(g-b)); 


theta=acos(num./(den+eps)); 


H-theta; 
H(b7g)-2*pi-H(b7g); 
H-H/(2*pi); 


num-min(min(r,g),b); 
den=r+g+b; 
den(den==0)=eps; 
S=1-3.*num./den; 
H(S==0)=0; 
I=(r+g+b)/3; 


% 将 H、S 和 I 三 个 分 量 合并 


hsi-cat(3,H,S,I); 
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Command Window J o! Workspace 


>> Iziaread{' piclT. jpg' ) ; fa] mí 79] a HA | sve: Ba OLE Select data to plot 
+> hsi=reb2hsi (I): ara a C A a a 
+» subplot (1, 2, 1), imshow (I) : Hr Cx 37Üx3 uint? ü 255 
»» subplot (1, 2, 2), inshow(hsi) 图 hai (240x320x3 deuble? — 0 1 
fx » | | 


a) 








3-5 WFE 3-2 的 运行 过 程 及 结 
a) 运行 过 程 b)RGB 空间 图 像 ec) HSI 空间 图 像 


彩色 增强 


彩色 增强 在 网 像 处 理 中 应 用 十 分 广泛 且 效 果 显 苦 。 人 的 视觉 系统 对 彩色 相当 敏感 ， 人 有 眼 
一 般 能 区 分 的 灰 度 级 别 只 有 20 多 个 ， 而 对 不 同 亮度 和 色调 的 彩色 图 像 的 分 辨 能 力 可 达到 灰 
度 分 辨 能 力 的 百倍 以 上 。 彩 色 增 强 就 是 根据 人 的 这 个 特点 ， 将 彩色 用 于 网 像 增 强 之 中 ， 从 而 
提高 了 图 像 的 可 分 辨 性 。 

伪 彩 色 增 强 是 将 一 个 波段 或 单一 的 黑白 网 像 变换 为 彩色 岁 像 ， 从 而 把 人 眼 不 能 区 分 的 微 
小 灰 度 差别 显示 为 明显 的 色彩 差异 ， 以 便于 解 译 和 提取 有 用 信息 。 下 面 介 绍 两 种 常用 的 伪 彩 
增强 的 方法 。 

(1) 密度 分 割 法 

密度 分 割 或 密度 分 层 是 伪 彩 色 增 强 中 最 简单 的 一 种 方法 ， 它 对 图 像 亮度 范围 进行 分 割 ， 
从 而 有 利于 图 像 的 增强 和 分 类 。 它 把 黑白 图 像 的 灰 度 级 从 0( 黑 ) 到 MW( 白 ) 分 成 入 个 区 间 
万 ， 关 12…，N， 给 每 个 区 间 Li 指定 一 种 彩色 Ci， 这 样 即 可 把 一 幅 灰 度 图 像 变 成 一 幅 伪 彩色 
图 像 ， 其 实现 方法 如 例 程 3-3 所 示 ， 图 3-6 所 示 是 例 程 3-3 的 运行 结果 。 

例 程 3-3 
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a-imread('yannangui.jpg); 
a—-rgb2gray(a); 
subplot(121);imshow(a);title( 7k E B12; 
c—zeros(size(a)); 

pos-find(a«20); 

c(pos)-a(pos); 

b(:,:,3)76; 

c—zeros(size(a)); 











"MATLAB xss54:2: 


pos-find((a»—20)&(a«40)); 

c(pos)-a(pos); 

b(:,:2)76; 

c—zeros(size(a)); 

pos-find(a^—40); 

c(pos)-a(pos); 

b(:,:,1)76; 

b-uint8(b); 

subplot(122);imshow(b);title( 4 238 o5 Jr: W ERN; 
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a) b) 


图 3-6 例 程 3-3 的 运行 结果 
a) 灰 度 图 像 b) 伪 彩 增强 后 的 图 像 


(2) 空间 域 灰 度 级 -彩色 变换 

与 密度 分 割 不 同 ， 空 间 域 灰 度 级 -彩色 变换 是 一 种 更 为 党 用 、 更 有 效 的 伪 彩 色 增 强 法 。 
它 根据 色 度 学 的 原理 ， 将 原 图 像 7 x, y) 的 灰 度 分 段 经 过 红 、 绿 、 蓝 三 个 独立 变换 
TR(。)、TG(。)、TB(。)， 变 成 红 、 绿 、 蓝 三 种 基色 分 量 RE y». G Go y) fI B (x, y), 
然后 用 它们 分 别 去 控制 彩色 显示 器 的 红 、 绿 、 蓝 电子 枪 ， 便 可 以 在 彩色 显示 器 的 屏幕 上 合成 
一 幅 彩 色 图 像 。 三 个 变换 是 独立 的 ， 彩 色 的 含量 由 变换 函数 TR.) TG) TB ° ) 的 形状 
而 定 。 但 是 ， 在 实际 应 用 中 这 三 个 变换 函数 一 般 取 同一 类 函数 ， 例 如 ， 可 以 取 市 绝对 值 的 正 
弦 疯 数 ， 也 可 以 取 线 性 变换 函数 。 典 型 的 变换 函数 如 图 3-7 PR, KEWA, L], 
个 变换 取 不 同 的 分 割 线性 函数 。 
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a) b) 
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L/4 112 3L/4 L f i LIA ZL2314 L F 
c) d) 
图 3-7 Hi EJER RES £6 36 168 PR C 
a) 红色 b) 绿色 c) HE d) 红 、 绿 、 蓝 三 色 之 间 的 关系 


例 程 3-4 以 picl8jpg 图 像 为 例 ， 对 其 利用 空间 域 灰 度 级 -彩色 变换 法 进行 伪 彩 色 增 强 。 
MATLAB 程序 代码 如 下 。 其 运行 后 结果 如 图 3-8 所 示 。 
例 程 3-4 


炒米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 炒米 米 米 米 米 米 米 炒米 米 米 米 炒米 米 米 米 米 炒米 米 米 米 米 米 米 米 米 米 米 米 米 炒米 米 米 米 米 炒米 米 米 炒米 炒米 米 米 米 米 


clear 
I-imread('pic18.jpg; 
I-rgb2gray(1); 
subplot(121),imshow(D,title(' I 4&5 Fd f); 
I-double(T); 
[M,N]^size(I); 
L=256; 
for i-1:M 
for j-1:N 
if I(1,) «L/4 
R(1,j)-0; 
G()-4*1(,)); 
B(ij)-L; 
else if I(1,) «—L/2 
RG,j)=0; 
G(i)-L; 
B(1,)74*1(1,)*2*L; 
else if I(1,))«—3*L/4 
R(1,)74*1(1,])-2*L; 
G(i)-L; 
B(i,)-0; 
else 
R(ij)-L; 
G(i,j)7-4*1(1,)) -4*L; 
B(i,)-0; 
end 
end 
end 


end 
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end 
for i-1:M 
for j-1:N 
G2C(1], D)-R(1,j); 
G2C(1,,2)-G(1]); 
G2C(1,3)-B(1,]); 
end 
end 
G2C-7G2C/256; 
subplot(122),imshow(G2C),title《 伪 彩 增强 后 的 图 像 "): 
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a) b) 
图 3-8 WFE 3-4 的 运行 结果 
a) 灰 度 图 像 b) 伪 彩 增强 后 的 图 像 


3.2 图 像 的 直方 图 


XE 灰 度 直方 图 

在 数字 图 像 处 理 中 ， 灰 度 直方 图 是 最 简单 晶 最 有 用 的 工具 。 直 方 图 表达 的 信息 是 每 种 亮 

度 的 像素 点 的 个 数 。 直 方 图 是 图 像 的 一 个 重要 特征 ， 因 为 直方 图 能 够 用 少量 的 数据 表达 图 像 
的 灰 度 统计 特征 。 图 3-9 所 示 为 直方 图 的 求 值 过 程 。 

Jk BE EL 73 [8] 
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图 3-9 求 图 像 灰 度 卫 方 图 的 过 程 
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JAVA. fFAJGEÉEVARISUKHE EO RE? KERE, L-1] 2506 EREA Fe 
是 一 个 离散 函数 : 


p.) = 二 
KP, n 是 图 像 的 像素 总 数 ，n, 是 图 像 中 第 个 灰 度 级 的 像素 总 数 ，x, 是 第 有 个 灰 度 
级 ，k=0,1,2,…,L-1。 


EEEA pz 
Ee 3-5 AER 5 RRR BUT FS E Xn 53 HJSKZKBE REAN KIT] MATLAB WFE, 
行 结果 如 图 3-10 所 示 。 
p 3-5 


% 谈 入 图 像 ; 
I-imread('taishan.jpg; 
% 将 RGB EMETHIR KE EIE: 
BO-rgb2gray(1); 
Vet EVER PEBJAS A EE NODUS BET, EFA SERT 
B-double(B0); 
% 求 图 像 的 行 数 与 列 数 ; 
s=size(B); 
% 建 立 一 个 数组 ， 用 于 存储 1 一 256 灰 度 级 出 现 的 个 数 ; 
h-zeros(1,256); 
% 根 据 定义 ， 计 算 各 像 聚 灰 度 值 出 现 的 个 数 ; 
for 1=1:s(1) 
for j=1:s(2) 
k=BQ,); 
k=floor(k); 
h(k+1)=h(k+1)+1; 
end 

















end 
Vo 显示 图 像 ; 
subplot(121),imshow(B0); 
subplot(122),plot(h) 


例 程 3-5 中 ， 语 句 h-zeros (1,256) 的 作用 是 先生 成 1x256 的 全 零 数 组 ， 即 采用 数组 预 
分 配 的 方法 提高 运算 的 速度 。 语句 h (krl) =h (kH) +1 中 数组 下 标 用 kr1， 目 的 是 避免 下 
标 为 0。 

在 MATLAB 数字 图 像 处 理工 具 箱 中 ， 提 供 了 imhist0 函 数 来 计算 并 绘制 灰 度 图 像 的 直方 
图 ， 其 调用 格式 如 下 。 

















imhist (CI, n) 
该 函数 的 功能 是 计算 和 显示 图 像 D 的 灰 度 直方 多，7 为 指定 的 灰 度 级 数目 ， 默 认为 256。 
如 果 了 是 二 值 图 像 ， 那 么 冯 仅 有 两 个 值 。 
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a) b) 
3-10 ”输入 的 图 像 及 其 直方 图 
a) 输入 的 原始 图 像 b) 灰 度 直方 图 








例 程 3-6 十 运用 imhist0 〇 函数 来 计算 并 显示 图 像 的 灰 度 古方 图 的 MATLAB 源 程序 ， 其 运 
行 结果 如 图 3-11 所 示 。 
fite 3-6 
oLELLLLLLLELELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL 
I-imread('guilin.jpg^; 
I-rgb2gray(1); 
subplot(121),imshow(I) 
subplot(122),imhist(T) 
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a) b) 
3-11 例 程 3-6 的 运行 结 
a) 输入 的 原始 图 像 ”b) 灰 度 直方 图 





效 子 图 像 分 析 









对 于 RGB 图 像 ， 可 以 将 图 像 分 解 为 R、G、B 图 像 后 ， 再 对 分 解 后 的 二 维 图 像 求 其 R, 
G. B 分 量 的 直方 图 。 例 程 3-7 便 是 求 彩色 图 像 直 方 图 的 MATLAB 源 程 序 ，RGB KI RR. 
直方 图 如 图 3-12 所 示 。 

例 程 3-7 
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I-imread('pubu.jpg^; 
subplot(141),imshow(TI); 
subplot(221),imshow(L); 

% R 分 量 的 灰 度 直方 图 
subplot(222),imhist(I(:,:,1)); 
% G 分 量 的 灰 度 直方 图 
subplot(223),imhist(I(:,:,2)); 
% B 分 量 的 灰 度 直方 图 
subplot(224),imhist(I(:,:,3)); 
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c) d) 
3-12 输入 的 RGB 图 像 及 其 R、G、B 三 个 分 量 的 灰 度 直方 图 
a) 输入 的 原始 图 像 ”b) R 分 量 的 灰 度 直方 图 c) G 分 量 的 灰 度 直方 图 d) B 分 量 的 灰 度 直方 图 












应 用 : 基于 直方 图 的 对 比 度 增强 “| 
图 像 内 各 像素 的 灰 度 值 是 图 像 的 重要 数据 ， 但 是 由 于 受 输入 设备 的 影响 ， 往 往 得 不 到 图 像 
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的 理想 灰 度 值 。 例 如 在 摄像 机 观测 井下 视频 监控 系统 图 像 时 ， 图 像 画 面 的 感光 度 随 场合 的 不 同 
会 有 很 大 差别 ， 表 现 为 网 像 的 对 比 度 不 足 ， 使 图 像 细节 不 清 、 画 面 模糊 。 另 外 ， 对 井下 视频 监 
探 系 统 而 言 ， 由 于 环境 光线 不 足 ， 造 成 了 灰 度 变化 的 不 明显 ， 为 边缘 特征 的 提取 增加 了 难度 。 
为 此 ， 需 要 对 疼 像 的 每 一 灰 度 级 进行 变换 ， 扩 大 图 像 的 灰 度 范围 ， 从 而 增强 图像 的 请 晰 度 。 

G) 比例 线性 变换 

成 像 时 感光 不 足 或 过 度 、 非 线性 动态 范围 太 军 等 因素 ， 都 会 造成 图 像 对 比 度 不 足 ， 使 得 
图 像 中 的 细节 分 辨 不 清 。 

假设 原 图 像 f(x,y) 的 灰 度 范围 为 |a,b| ， 和 希望 变换 后 图 像 g(x,y) 的 动态 范围 为 [c,d] ， 
则 可 以 利用 以 下 公式 来 实现 变换 ， 即 























(2) 分 段 线性 变换 
采用 分 段 线 性 变换 的 方法 ， 主 要 是 对 感 兴趣 区 域 进 行 灰 度 增强 ， 假 设 感 兴趣 区 域 是 
(a,5)， 可 以 采用 以 下 的 分 段 变 换 公式 。 
C f(x,y)«a 
g(x, y)- d foy)» b 
(d—c)Lf(x,y) -al/(b-a)-c a< f(x,y)<b 
(3) JEZETPEZKRE (AER RR 
这 种 方法 的 目标 与 增强 对 比 上 度 相 反 。 当 诛 图 的 动态 范围 太 大 ， 超 出 了 东 些 显示 设备 所 多 
许 的 动态 范围 时 ， 可 采用 对 数 形式 的 变换 函数 进行 动态 郊 围 压缩 : 
g(x,y)= clog(l + f (x, y) 





其 中 ，c 是 比例 尺 常数 。 
例 程 3-8 是 对 图 像 进行 对 数 灰 度 值 变换 的 MATLAB 源 程 序 。 
例 程 3-8 
KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 
Vo 读 入 原始 图 像 并 进行 灰 度 转换 
I-imread('yellowriver.jpg); 
Xl-rgb2gray(D); 
figure,imshow(X1); 
Vo 进行 次 上 度 值 对 数 变 换 
c-255/1og(256); 
x70:1:255; 
y-c*log(14x); 











figure,plot(x,y) 
xlabel('f),ylabel('g") 
title('intensitytransformation') 
% 绘 制 变换 曲线 
[m,n]»size(X1); 
X2-double(X1); 

for i-1:m 
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for j=1:n 
g(1,)-0; 
g(i)-c*log(X2(1,)*1); 


end 
end 


figurejiimshow(mat2gray(g)) 
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(40 直方 图 均衡 化 

直方 图 均衡 化 是 将 原 图 像 通过 某 种 变换 ， 得 到 一 幅 灰 上 度 直 方 图 为 均匀 分 布 的 狐 图 像 的 方 
法 ， 这 样 增加 了 像素 灰 度 值 的 动态 范围 ， 从 而 达到 增强 图 像 整 体 对 比 度 的 效果 。 

直方 图 均衡 化 过 程 如 下 。 

D 列 出 原始 网 灰 度 级 rro 

2) 统计 原始 直方 图 各 灰 上 度 级 像素 数 ni。 

3) 计算 原始 直方 图 各 概 人 这 : px=nyN Ck-0,12,:-:,L-1). 

4) 计算 累计 直方 图 : Si È Dye 

5) 取 整 S,-int((L-1)s7-0.51. 

6) MERATE: r Sko 

7) 统计 新 直方 多 各 灰 度 级 像素 nx'。 

8) 用 px(sj)=nx7N 计算 新 直方 图 。 

直方 多 均衡 化 不 改变 灰 度 出 现 的 次 数 ， 改 变 的 是 出 现 次 数 所 对 应 的 灰 度 级 ， 以 避免 改变 
图 像 的 信息 结构 。 和 直方 图 均衡 化 力图 使 等 长 区 间 内 出 现 的 像素 数 接近 相等 。 

从 人 了 眼 视 完 特 性 来 考虑 ， 一 幅 图 像 的 直方 图 如 果 是 均匀 分 布 的 ， 该 图像 色 调 给 人 的 感觉 
比较 协调 。 因 此 将 原 图 像 直 方 图 调整 为 均匀 分 布 的 直方 图 ， 这 样 修正 后 的 图 像 能 满足 人 眼 视 
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觉 要 求 。 
例 程 3-9 是 对 图 像 进行 直方 图 均衡 化 的 MATLAB 源 程序 。 
例 程 3-9 


KOK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 
A ER JT RICE PR 

x = imread(' diaosu.]pg); 

x—rgb2gray(x); 

[width,height]|-size(x); 





% 计 算 原 图 直方 图 
h = zeros(1,256); 
170; 
m=1; 
for k=0:1:255 
for 1=1:1:width 
for Jj=1:1:height 
if x(1,))==k 

]=] 十 ] ; 


else continue 











MATLAB xs: 


end 
end 
end 
h(m)=l;1=0; 
m=m+1; 


end 


% 总 像素 
nf-width*height; 
% 分 布 概率 
hs-zeros(1,256); 
for 171:1:256 

hs(i)-h(i)/nf; 
end 


ARERIA 

hp=zeros(1,256); 

temp=0; 

for i71:1:256 
temp-hs(i)*temp; 
hp(i)-temp; 

end 


969r AK SE 4H 

g=zeros( 1,256); 

for 1=1:1:256 
g(i)=round(255*hp(i)); 

end 


WRR ERIH RZE 
for k=1:1:255 
for i-1:1:width 
for j-1:1:height 
if x(1,]))7—k 
y(1j)-g(k); 
end 
end 
end 
end 


% 图 像 显 示 
z=0:1:255; 


AIR Fiv 
w = zeros( 1,256); 
170; 








数字 图 像 分 析 





m-l; 
for k-0:1:255 
for i-1:1:width 
for j71:1:height 
if'y(1j)— 
]=] 十 ] ; 





else continue 
end 
end 
end 
w(m)=];]=0; 
m=m 十 ] ; 
end 
subplot(2,2,1),1mshow(uint8(x)); 
subplot(2,2,2),plot(z,h); 
subplot(2,2,3),imshow(uint8(y)); 
subplot(2,2,4),plot(z,w); 
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例 程 3-9 的 运行 结果 如 图 3-13 所 示 。 





M | li i ul 


c) d) 
图 3-13 
a) 输入 的 原始 图 像 b) 原始 图 像 的 直方 图 c) 直方 图 均衡 化 后 图 像 ”d) 均衡 化 后 的 直方 图 


MATLAB 图 像 处 理工 具 箱 提供 了 用 于 直方 图 均衡 化 的 函数 histeq( )， 其 语法 格式 为 : 
J-histeq(Lin) 
其 中 ，7 为 输入 的 原始 灰 度 图 像 ，7 表示 和 输出 图 像 的 灰 度 级 数目 ， 它 是 一 个 可 选 参数 ， 











"MATLAB x55: 


SAU BA 64. 

例 程 3-10 是 利用 函数 histe ) 进 行 直 方 图 均衡 化 的 MATLAB 程序 ， 其 运行 结果 如 图 3-14 
所 示 。 

例 程 3-10 
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I-imread(' diaosu.]pg ); 
I-rgb2gray(lI); 
J-histeq(I); 

subplot(21 1),imshow(I) 
subplot(212),imshow(J) 
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图 3-14 dfi 3-10 的 运行 结 
a) 输入 的 图 像 b) 直方 图 均衡 化 后 的 图 像 

ET EE A e ES OT EE ELA EE T TEE EE ÁN 
| 经 验 分 享 : 对 灰 度 直方 图 的 理解 

(1) 灰 度 直方 图 只 能 反映 图 像 的 灰 度 分 布 情况 ， 而 不 能 反映 图 像 像 素 的 位 置 ， 即 丢失 
了 像素 的 位 置信 息 。 

(2) 一 幅 图 像 对 应 唯一 的 灰 度 直方 图 ， 反 之 不 成 立 。 不 同 的 图 像 可 对 应 相同 的 直方 图 。 

(3) 灰 度 直方 图 反映 了 数字 图 像 中 每 一 灰 度 级 与 其 出 现 频率 间 的 关系 , 它 能 描述 该 图 像 
i mmt. 


X= 


3.3 图 像 的 纹理 特征 分 析 
XXI 什么 是 “图 像 的 纹理 特征 ” 


目前 ， 人 人 们 对 图 像 纹 理 特征 的 含义 理解 不 尽 相 同 ， 纹 理 有 时 被 称 为 结构 、 影 纹 等 。 


puppe cesa pru 
ee 
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Pickett 认为 纹理 是 保持 一 定 的 特征 重复 性 并 且 间 隔 规 律 可 以 任意 安排 的 空间 结构 ，HawKins 
认为 纹理 共有 三 大 标志 : 某 种 局 部 序列 性 不 断 重 复 、 非 随机 排列 和 纹理 区 域内 大 致 为 均匀 的 
统一 体 ;， LiWang 和 D. C. He 认为 ， 纹 理 是 由 纹理 基 元 组 成 的 ， 纹 理 基 元 被 认为 是 表现 纹理 
特征 的 最 小 单元 ， 是 一 个 像 元 在 其 周围 8 个 方向 上 的 特征 的 反映 。 纹 理 特征 有 时 是 明显 的 ， (>) 
以 某 种 基本 图 形 在 某 一 地 区 有 规律 的 周期 性 出 现 ， 例 如 大 面积 森林 覆盖 地 区 的 影像 构成 的 纹 
理 为 斑点 状 ， 沙 漠 地 区 的 影像 构成 的 纹理 为 链 状 、 新 月 状 等 ， 而 有 时 纹理 特征 是 不 明显 的 、 
隐 星 的 ， 具 有 不 稳定 性 。 绿 上 所 述 ， 可 以 认为 图 像 的 纹理 就 是 由 纹理 其 元 按照 某 种 确定 性 的 
规律 或 统计 规律 排列 组 成 的 ， 前 者 称 为 确定 性 纹理 (例如 人 工 纹理 )， 而 后 者 则 被 称 为 随机 
性 纹理 (如 目 然 纹理 )。 

纹理 作为 一 种 区 域 特 征 ， 是 对 于 图 像 各 像 元 之 间 空 间 分 布 的 一 种 描述 。 由 于 纹理 能 充分 
利用 图 像 信 息 ， 无 论 从 理论 上 还 是 常识 出 发 它 都 可 以 成 为 描述 与 识别 图 像 的 重要 依据 ， 与 其 
他 图 像 特 征 相 比 ， 它 能 更 好 地 兼顾 图 像 宏 观 性 质 与 细微 结构 两 个 方面 ， 因 此 纹理 成 为 目标 识 
别 需 要 提取 的 重要 特征 。 

提取 纹理 特征 的 方法 很 多 ， 如 基于 局 部 统计 特性 的 特征 、 基 于 随机 场 模型 的 特征 、 基 于 
空间 频率 的 特征 、 分 形 特征 等 ， 其 中 ， 应 用 最 广泛 的 是 基于 灰 度 共生 和 矩阵 的 特征 。 


灰 度 共生 和 矩阵 


在 图 像 中 任 取 一 点 (x,y) 以 及 偏离 它 的 另 一 点 (x+a,y+5) ， 形 成 一 个 点 对 ， 设 该 点 对 
的 次 度 值 为 (i, 站， 即 点 Qo y) 的 次 度 为 i， 点 (x+a,y+5) 的 灰 度 为 。 固 定点 a 与 点 b， 令 
点 (x,) 在 整 幅 图 像 上 移动 ， 则 会 得 到 各 种 (i,j) 的 值 。 设 次 度 值 的 级 数 为 L， 则 i 与 j 的 组 合 
共有 工种。 在 整 幅 图 像 中 ， 统 计 出 每 一 种 (i, 站) 值 出 现 的 次 数 ， 青 将 它们 归 一 化 为 出 现 的 概 
KP o WEDE P | ， 为 灰 度 联合 概率 矩阵 ， 也 称 为 灰 


入 共生 矩阵。 灰 度 共生 和 矩阵 实际 上 束 是 两 像素 点 的 联合 直 
方 图 ， 其 形成 过 程 如 图 3-15 所 示 。 

VES 24) B (a, b) 取 不 同 的 数值 组 合 ， 可 以 得 到 沿 一 定 方 
向 (如 0? . 45? . 90? . 135? ) 相隔 一 定 距 离 
d-Na! +b 的 像 元 之 间 灰 度 联 合 概率 矩阵。a b 的 取 
值 要 根据 纹理 周期 分 布 的 特性 来 选择 。 当 a 与 5 取 值 较 小 ”图 3-15 灰 度 共 牛 矩阵 的 形成 过 程 
时 ， 对 应 于 变化 缓慢 的 纹理 图 像 〈 粗 纹理 )， 其 灰 度 联合 
概率 和 矩阵 对 角 线 上 的 数值 较 大 ， 倾 向 于 作对 角 线 分 布 ; 若 纹理 的 变化 较 快 ， 则 对 角 线 上 的 数 
值 越 小 ， 而 对 角 线 两 侧 上 的 元 率 值 增 大 ， 倾 问 于 均匀 分 布 。 

为 了 能 更 直观 地 以 共生 算 阵 描述 纹理 状况 ， 研 究 者 从 灰 度 共生 和 矩阵 导出 一 些 反 映 和 矩阵 状 
况 的 参数 ， 典 型 的 有 以 下 几 种 。 

(1) 能 量 

灰 度 共生 和 矩阵 元 素 值 的 平方 和 ， 也 称 能 量 。 它 反映 了 图 像 灰 度 分 布 的 均匀 程度 和 纹理 粗 
细 度 。 能 量 的 数学 定义 式 如 下 。 
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当 书 数值 分 布 较 集 中 时 ， 能 量 较 大 ;， 当 忆 数值 分 布 较 分 散 时 ， 则 能 量 
(2) 相关 


能 量 较 小 。 




















相关 是 度量 空间 灰 度 共生 矩阵 元 素 在 行 或 列 方 同 上 的 相似 程度 ， 因 此 ， 相 关 值 大 小 反映 
了 了 图像 中 局 部 灰 度 相关 性 。 当 短 阵 元 素 值 均匀 相等 时 ， 相 关 值 束 大 ; 相反 ， 如 来 沧 阵 像 元 值 
相差 很 大 ， 则 相关 值 束 小 。 相 关 的 数学 定义 式 如 下 。 


fL S i-u- )P,; 











x“ y i20 j=0 
了 一 | L-1 
RP, ues. 0. 0, 5I m, 2 V P, m, 2 V 的 均值 和 标准 差 。 
j=0 i=0 
L-1 L-1 
Hx = i» I 
i-0 j-0 
L-1 L-1 
Hu, 7 2) AF, 
j-0 i=0 


L-1 了 一 | 
o, - 5 -uY » P 
i-0 j-0 


L-1 L-1 
o, E S -1,) ŠP, 
j=0 i=0 

(3) Ji 











A5 X EVER PRAE KAREKERE, KE ER TERREA, ANERE E, 
ERIR T RAPAE EERE SE ARFRSE. MAEKA FP. 








L-1 L-1 
h= -5 2 P, log, P; 
i=0 j=0 
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L-1 L-1 


G per £j 


i-0 j=0 








对 于 粗 纹理 ， 忆 的 数值 集中 于 主 对 角 线 附近 ， 此 时 |- 咱 的 值 较 小 ， 所 以 反差 也 较 小 ; 
反之 ， 对 于 细 纹 理 ，P 的 数值 比较 均匀 ， 因 此 ， 反 差 较 大 。 


ERE 例 程 精 讲 


例 程 3-11 编写 的 是 一 个 计算 数字 图 像 灰 度 共生 矩阵 及 典型 参数 的 MATLAB 函数 。 
例 程 3-11 








K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 2K K K K K K K K K K 
function T = Texture(Image) 


% 功能 : 基于 共生 和 矩阵 纹理 特征 提取 ，d=1,0=0?” 45° ,90? ,13$” 共 四 个 和 矩阵 
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% 输入 : img- 图 像 
% 输出 : T- 返 回 八 维 纹理 特征 行 向 量 


% 
%1. 转 化 为 灰 度 图 像 
% 





Gray-rgb2gray(Image); 
[MN |msize(Gray); 





MEE 
%2. 为 了 减少 计算 量 ， 对 原始 图 像 灰 度 级 压缩 ， 将 Gray 量化 成 16 级 
% 

for i = 1:M 

forj=1:N 


for n = 1:256/16 

if (n-1)*16<=Gray(i,j)&Gray(i1,j)<=(n-1)*16+15 
Gray(i,j) = n-1; 

end 

end 

end 

end 





P = zeros(16,16,4); 

for m 7 1:16 

for n ^ 1:16 

fori = 1:M 

forj=1:N 

ifj P(m,n,1) = P(m,n,1)+1; 
P(n,m,1) = P(m,n,1); 

end 

ifi>l&j P(m,n,2) = P(m,n,2)+1; 
P(n,m,2) = P(m,n,2); 

end 

if i P(m,n,3) = P(m,n,3)+1; 
P(n,m,3) = P(m,n,3); 

end 

if i P(m,n,4) = P(m,n,4)*1; 
P(n,m,4) = P(m,n,4); 

end 

end 

end 

if m--n 

P(m,n,:) = P(m,n,:)*2; 

















end 

end 

0%090--------------------------------------------------------- 

Vo 对 共生 和 矩阵 归 一 化 
%090--------------------------------------------------------- 

for n= 1:4 

P(:,:,n) = P(:,:,n)/sum(sum(P(:,:,n))); 

end 
ea re We ene t 
%4. 对 共生 算 阵 计算 能 量 、 烂 、 反 过 、 相 关 4 个 纹理 参数 
17 EEE NS ort TENS WS ET WA A EEEE 
H = zeros(1,4); 

I-H; 

Ux = H; Uy = H; 

deltaX- H; deltaY = H; 

C =H; 

for n = 1:4 

E(n) = sum(sum(P(:,:,n).^2)); %% 能 量 

fori= 1:16 


forj=1:16 

if P(1,j,n)——0 

H) = -P(i,j,n)*log(P(i,j,n))-H(n); 96964 
end 

I(n) = (i-)^2*P(i,j,n)*T(n); AAW TER 


Ux(n) = i*P(i,j,n)-Ux(n); % 相 关 性 中 x 
Uy(n) = j*P(j,n)-Uy(n); % 相 关 性 中 hy 


end 
end 
end 
for n= 1:4 
fori- 1:16 
for ] = 1:16 


deltaX(n) = (i-Ux(n))^2*P(i,j,n)*deltaX(n); % 相 关 性 中 ox 
deltaY(n) = GO-Uy(n) 人 ^2*P(i,j,n)+deltaY(n); % 相 关 性 中 oy 
C(n) = i*j*P(1,j,n)*C(n); 

end 

end 

C(n) = (C(n)-Ux(n)*Uy(n))/deltaX(n)/deltaY (n); % 相 关 性 
end 








% 求 能 量 、 炳 、 反 兰 、 相 关 的 均值 和 标准 将 作 为 最 终 8 维 纹理 特征 








T(1) = mean(E); T(2) = sqrt(cov(E)); 
T(3) = mean(H); T(4) = sqrt(cov(H)); 
T(5) = mean(l); T(6) = sqrt(cov(I)); 

T(7) = mean(C); T(8) = sqrt(cov(C)); 


oLELLLLLLLELELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL 


在 MATLAB 数字 图 像 处 理工 具 箱 中 ， 拓 供 了 一 个 计算 图 像 灰 度 共生 和 矩阵 的 函数 ， 其 使 
用 语法 如 下 。 








glcms-graycomatrix(I) 


通 : 灰 度 -梯度 共生 和 矩阵 

















纹理 特征 分 析 既 可 以 用 灰 度 本 吴 的 信息 ， 又 可 以 用 灰 度 变化 的 柳 度 信息 。 灰 度 - 樟 度 共 
生 和 矩阵 纹理 分 析 方 法 是 用 灰 度 和 樟 上 度 的 综合 信息 提取 纹理 特征 ， 它 竹 虑 像素 灰 度 与 边缘 樟 度 
的 联合 统计 分 布 ， 其 实现 过 程 与 灰 度 共生 和 窃 阵 法 相似 。 

设 图 像 为 f(x,y)，x=1,2,…,M ,y=1,2,…,N ， 其 灰 度 级 为 L。 用 梯度 算 子 提取 原始 图 
像 的 梯度 图 像 g(x,y) 。 把 们 度 网 像 进行 灰 度 级 离 敢 化 ， 设 灰 度 级 数目 为 到 ， 新 的 灰 度 为 



































G(x, y) = S02) - fun (L, -1) 


max min 


AH. g-maxg(x,y). g,,-ming(x,y). 
Xy X,Y 
RHM, BEIEKIÉUSGQuy). x-L2,-,M.y-L2,-.N. HJKIESRUN L, o 
灰 度 -梯度 共生 矩阵 为 1 本 ;= 0,1,11; j=0,1,.L 1， 其 中 ， 且 ,定义 为 集合 y) 

















ij? 
Læn LGG,y) PERKA. | Hu | ， 作 归 一 化 处 理 ， 得 到 | 瑟 | ，， 其 中 ， 
= H; 
ij T L, -l " 
H; 
i=0 j=0 
利用 灰 度 -梯度 共生 矩阵 ， 可 以 推导 出 常用 的 纹理 特征 统计 量 ， 如 表 3-2 所 示 。 
表 3-2 常用 的 纹理 特征 统计 量 
小 梯度 优势 px 3 





大 梯度 优势 


梯度 分 布 不 均匀 性 


L-1 | Lg 
灰 度 平均 r-i SP 
i=0 | j=0 


B= y UIP 
i=0 j 


- — Ü 
ea 








灰 度 分 布 不 均匀 性 
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名 —W 数学 表达 式 
L- L.d 
梯度 平均 T) - G-Ty » «| 
i-0 j-0 
L-1 Lg-l 
PENT Z To = G- - )P, 
i=0 j=0 
IKREN 


LA L 


HAN n,--». Y ? 








IURE 3-12 是 求 图 像 的 灰 度 -梯度 矩阵 及 相关 纹理 特征 统计 量 的 MATLAB 源 程序 。 
例 程 3-12 
KOK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 


function OUT=GrayGradinet(IN) 
% 功能 : 求 图 像 的 灰 度 -梯度 矩阵 及 相关 纹理 特征 统计 量 
Vo 输入 : IN- 灰 度 图 像 

% 输出 : OUT- 纹 理 特征 统计 量 和 矩阵 
vo 灰 度 梯度 共生 算 阵 H 

Vo HRE H basic 
% 小 梯度 优势 TI 

Vo 大 梯度 优势 T2 

vo 灰 度 分 布 的 不 均匀 性 T3 

% 梯度 分 布 的 不 均匀 性 T4 

% fem TS 

% 灰 度 平均 T6 

% 梯度 平均 T7 

% KEITA T8 

% 梯度 均 方 差 T9 

% 相关 TIO 

vo KER T11 

% ER T12 

% i T13 

vo 惯性 T14 

% WAE TIS 





© 





© 





© 


© 





© 


gray—-256; 

[R,C]-size(IN); 

% 玉 用 平方 求 和 计算 梯度 矩阵 
GM=zeros(R-1,C-1); 

for 1=1:R-1 
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for j71:C-1 
n GM-(IN(1,-1)-IN(1))^ 2--(IN(1*1,])-IN(1,])))^2; 
GM(i,j)*sqrt(double(n GM)); 


end 
end > 


% figure, , mshow(GM); 

% 找 出 最 大 值 最 小 值 

n min-min(GM(:)); 

n max-max(GM(:)); 

AFER RE ECKE SR ARCU 

% 设 置 新 的 灰 度 级 为 new. gray 

new gray=32; 

% 新 的 梯度 惩 阵 为 new_GM 

new GM-zeros(R-1,C-1); 

new GMc-uint8((GM-n min)(n max-n min)*(new gray-1)); 








oV AR IK SESS EJAIERB PE 
Vo ERR EEECBUSRRIEZESUP 1, ZKA SERRE S ER 
H-zeros(gray,new gray); 
for i7 1:R-1 
for j71:C-1 
H(IN(1,)*1,new GM(1,)+1)= H(IN(ij)*1,new GM(i,j)1)*1; 
end 





end 

99H — IK BEBSREXRIE H basic 
total-i*j; 

H basic-H/total; 








% 小 梯度 优势 TI 

TT=sum(H); 

T1=0; 

for j-l:new gray 
TI-TI-*TT(1,))/]^2; 

end 

T1=T 1/total; 


% 计 算 大 标 度 优势 T2 

T2=0; 

for j-1:new gray 
T2-T2-*TT(1,])*(-1); 

end 

T2-T2/total; 


% 计 算 灰 度 分 布 的 不 均匀 性 T3 
1320; 
TT1-sum(H); 








MATLAB sss 





for j-1:gray 
T3-T3-*TT1(1,])^2; 

end 

T3-T3/total; 


% 计 算 梯度 分 布 的 不 均匀 性 T4 

T4=0; 

for j=l:new gray 
TA4-T4*TT(1,])^2; 

end 

T4-T4/total; 


% 计 算 能 量 TS 
1520; 
for i-l:gray 
for j-1:new gray 
T5-TS5-H basic(1,])^2; 
end 
end 


% 计 算 灰 度 平均 T6 
TT2=sum((H basic)’; 
T6=0; 
for j=1:gray 

T6-T6* (j-1)*TT2(1,j); 
end 


% 计 算 梯度 平均 T7 

17-70; 

TT3-sum(H basic); 

for j-1:new gray 
T7-T7-*(j]-1)*TT3(1,]); 

end 


% 计 算 灰 度 均 方 着 T8 
T8=0; 
for j=l :gray 
T8-T8-(j-1-T6)^2* TT2(1,]); 
end 
T8-sqrt(T8); 


ov CBS RET; 25 T9 

19-0; 

for j-l:new gray 
T9-T9-*(j-1-T7)^2* TT3(1,)); 

end 
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T9=sqrt(T9); 


% 计算 相关 TIO 
T10=0; 
for i-l:gray 
for j-l:new gray 
T10-TI1O-(i-1-T6)*(j-1-T7)*H basic(i,j); 
end 





end 


VovE AS AKTE TII 
T1120; 
for J=1:gray 
T11-7TI I4 TT2(1,])*log10(TT2(1,j)*eps); 
end 
T11—TI11; 


Voy ESTESA T12 
T1220; 
for j-l:new gray 
T12-TI2-4TT3(1,j)*logl O(TT3(1,j)*eps); 
end 
T12—-T12; 


ov ARGUS T13 
T1320; 
for i-l:gray 
for j-1:new gray 
T13=T13+H basic(i,)*logl0(H basic(i,])**eps); 
end 
end 
T13=-T13; 


% 计 算 惯 性 T14 
T14=0; 
for 1=1:gray 
for j=l:new_gray 
Tl4-T14-(i-])^2*H basic(1,j); 
end 
end 


Voy RAAE TIS 
T1520; 
for i-l:gray 
for j-1:new gray 
TI5-TIS5-*H basic(i,j)/(1-(1i-])^2); 
end 
end 
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x-1:50:750; 
OUT(1,1)-TI; 
OUT(1,2)-T2; 
OUT(1,3)=T3; 
OUT(1,4)=T4; 
OUT(1,5)=T5; 
OUT(1,6)=T6; 
OUT(1,7)= 工 7; 
OUT(1,8)=T8; 
OUT(1,9)=T9; 
OUT(1,10)=T10; 
OUT(1,11)=T11; 
OUT(1,12)=T12; 
OUT(1,13)=T13; 
OUT(1,14)=T14; 
OUT(1,15)=T15; 


KOK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 2K 2K K K K K K K K 


3.4 图像 的 自 相 关 函 数 


粗糙 程度 是 图 像 纹 理 的 一 个 重要 特征 。 纹 理 是 由 纹理 基 元 在 空间 的 重复 排列 组 成 的 ， 
此 ， 纹 理 与 纹理 基 元 的 空间 尺寸 有 关 ， 并 且 大 尺寸 的 纹理 基 元 对 应 于 较 粗 的 纹理 ， 而 小 尺寸 
的 纹理 基 元 将 对 应 较 细 的 纹理 。 如 来 纹理 基 元 较 大 ， 则 目 相 关 函 数 随 相 关 距 离 增 大 而 缓慢 下 
降 ; 如 果 纹 理 基 元 较 小 ， 则 目 相 关 函 数 随 相关 距离 的 增 大 而 迅速 下 降 ， 因 此 ， 可 以 采用 目 相 
关 函 数 来 接 述 纹理 基 元 的 尺寸 特征 。 


图 像 的 目 相 天 函数 
设 图 像 为 fhi j), 网 其 目 相 关 函 数 定 义 为 









































plx y) == C, x,y >20 Cas 


i-0 j-0 
Rr, p(x.y) 也 可 以 视 为 一 幅 图 像 ， 其 大 小 为 NxN o 目 相 关 函 数 p (x, y) BE x, y 的 


大 小 而 变化 ， 与 图 像 中 纹理 粗细 的 变化 有 着 对 应 关系 。 
图 像 的 目 相 天 函 数 能 够 表示 纹理 的 粗粮 程度 。 当 式 (371) P x,y 变化 时 ， 粗 纹理 图 像 


的 目 相 关 函 数 随 4 = Vx +y” 的 下 降 而 变化 速度 缓慢 ， 而 细 纹 理 图 像 则 恰恰 相反 。 


EY ouis c 


TEE 3-13 编写 的 是 一 个 计算 数 子 图 像 晶 相关 函数 的 MATLAB 函数 。 
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L1 
例 程 3-13 
KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K kK k 


function [c]=autocorcoeficient(A,shiftx,shifty) 

% 功能 ， 计 算数 字 图 像 的 自 相 关 函 数 
Vo 输入 : A- HEIKE BRAE E 

% shiftx,shifty- 偏 移 量 ; 

% 输 出 : c- 二 维 灰 度 图 像 的 目 相 关 函 数 ; 
[M,N|=size(A); 
B=zeros(M+abs(shiftx),N+abs(shifty)); 
A=double(A); 

B=double(B); 
Vol EE EE REPE, ES AS s ARREN 0 
if(shiftx20)& &(shifty^0) 
B(1:M,1:N)-A; 
end 
if(shiftx20)& &(shifty«0) 
B(1:M,abs(shifty)-*-1:abs(shifty)--N)-A; 
end 
if(shiftx«0)& &(shifty^0) 
B(abs(shiftx)*1:abs(shiftx)--M,1:N)-A; 
end 
if(shiftx«0)& &(shifty«0) 
B(abs(shiftx)*1:abs(shiftx)- M,abs(shifty)7-1:abs(shifty)-N)-A; 
end 
% 计 算 目 相关 系数 
sum1=0; 
sum2-0; 
for i-1:M 
for j-1:N 
sum1-suml *A(i,j)*B(1,]); 
sum2-sum2-*A(i,])* A(i,j); 
end 
end 


c-suml/sum2; 
KOK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 

















图 像 局 部 自 相关 函数 


对 图 像 的 某 一 个 局 部 区 域 ( 也 称 为 “窗口 ”) 进行 自 相 关 函 数 分 析 ， 称 为 图 像 局 部 自 相 
天 图 数 分 机 。 在 图 像 局 部 目 相 关 函 数 分 机 中 ， 如 末 疼 像 的 纹理 粗糙 度 发 生变 化 ， 那 么 ， 随 春 
“窗口 ”的 移动 ， 目 相关 函数 必然 要 发 生变 人 化， 因而， 图 像 局 部 目 相 关 函 数 亦 可 以 表征 图 像 
纹理 的 粗糙 程度 。 局 部 目 相关 函数 分 析 方 法 根据 窗口 移动 方式 不 同 可 分 为 非 重 登 窗口 法 和 重 
登 窗 口 法 。 非 重 登 窗口 法 是 指 窗口 在 图 像 中 请 动 时 ， 后 一 个 正方 形 窗口 与 前 一 个 正方 形 窗 口 
互 不 重 登 。 重 登 窗 口 法 是 窗口 在 网 像 中 滑动 时 ， 后 一 个 正方 形 窗 口 与 前 一 个 正方 形 窗口 有 部 
分 重 登 。 岁 像 局 部 目 相 关 函 数 分析 一 般 采 用 重 有 登 窗 口 法 。 
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3.5 ”视频 图 像 分 析 与 处 理 





数字 视频 是 数字 多 媒体 的 重要 组 成 部 分 。 数 字 视 频 是 数字 图 像 在 时 间 轴 上 的 扩展 ， 可 以 
将 视频 的 每 一 帧 视 为 一 幅 静 止 的 图 像 。 由 此 可 见 ， 视 频 序列 图 像 由 一 帧 一 帧 具有 相互 关联 的 
图 像 构成 ， 这 种 相互 关联 性 为 我 们 进行 视频 图 像 处 理 提供 了 便利 。 

视频 图 像 中 所 含 的 帧 数 、 每 帧 图 像 的 大 小 以 及 播放 的 速率 是 衡量 视频 图 像 的 重要 指标 。 
在 MATLAB 中 ， 提 供 了 AVIINFO() 函 数 来 获取 AVI 视频 的 信息 。 它 的 使 用 格式 如 下 。 


FILEINFO=AVIINFO (FILENAME) 


该 函数 的 功能 是 返回 一 个 结构 体 ， 每 个 字段 都 包含 有 AVI 文件 的 信息 。 
例如 ， 在 MATALB 工作 窗口 中 输入 如 下 语句 。 


FILEINFO=AVIINFO('vipboard') 
运行 后 ， 输 出 文件 信息 如 下 。 


FILEINFO = 

% 视频 文件 的 名 称 及 存储 地 址 
Filename: 'C:ProgramFiles:MATLAB R2010aNXoolbox ipblks wvipdemos vipboard.avi' 
% 文件 的 大 小 

FileSize: 29388288 

% 文件 生成 的 日 期 
FileModDate: '14- 八 月 -2009 00:10:02' 
% 视频 文件 所 包含 的 帧 数 
NumFrames: 340 

% 每 秒 钟 播放 的 帧 数 
FramesPerSecond: 30 

% 每 帧 图 像 的 矿 二 

Width: 360 

Height: 240 

% 每 帧 图 像 的 类 型 
ImageType: 'indexed' 

% 视频 是 否 被 压缩 
VideoCompression: 'none' 

% 图 像 的 质量 

Quality: 0 

% BE rp BH C HO 2 
NumColormapEntries: 256 


在 MATLAB 视频 处 理工 具 箱 中 ， 提 供 了 AVIREAD() 函 数 ， 它 可 以 将 一 个 AVI 文件 读 
到 MATLAB 的 视频 结构 中 ， 该 函数 的 用 法 如 下 。 


MOV= AVIREAD(FILENAME) 
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例 程 3-14 是 将 一 段 AVI 视频 文件 中 的 视频 帧 单独 存储 为 静止 图 像 的 MATLAB 源 程序 。 
例 程 3-14 
KK K K K KK KKK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 


function avi2jpg(avifile,jpgfile,n) > 
% 功能 : 将 一 段 AVI 视频 文件 中 的 视频 巾 蛙 独 存储 为 前 止 的 图 像 

% 输入 : avifile- 需 要 转换 的 AVI 文件 

% jpgfile- 转 换 后 的 jpg 文件 名 的 前 半 部 分 

% n- 需 要 提取 的 前 n Vot 





% TEX AVI 文件 ， 数 据 放 入 MATLAB Movie 格式 


mov=aviread(avifile); 


% 定位 MATLAB Movie 中 文件 的 数据 
temp-size(mov); 
fnum-temp(2); 
if n«fnum 
m-n; 
else 
m-fnum 


end 


% 逐 帧 提取 数据 ， 并 保存 为 jpg 文件 
for 二 1:n 
strtemp-strcat(]pgfile,int2str(1),'.]pg); 
imwrite(mov(1).cdata(:,:,:),strtemp) 
end 
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SEPA 101503: DERT 4T 


(1) 视频 序列 图 像 的 灰 度 直方 图 
由 3.5.1. 节 的 分 析 可 知 ， 对 视频 图 像 的 分 析 可 以 转化 成 对 每 一 帆 图 像 的 分 析 。 因 此 ， 可 
以 对 视频 中 的 每 一 帧 图 像 求 其 灰 肛 直方 图 。 
例 程 3-15 实现 的 功能 便 是 对 视频 序列 图 像 中 的 前 9 帧 图 像 求 颜色 直方 图 的 MAILAB 35 
程序 ， 其 运行 效 来 如 图 3-16 所 示 。 
例 程 3-15 
% 读 入 视频 序列 的 1 一 9 帧 图 像 ， 并 显示 
for 171:9 
% 将 i 从 整 型 变量 变 为 字符 型 
k-int2str(1); 
% 形 成 boardk.jpg' 的 文件 
kl1=strcat('board',k,'.jpg'); 
% 读 入 图 像 并 存储 ，i 用 来 表征 存储 的 帧 数 
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B(1,:,:)2-imread(k1); 
subplot(3,3,1),C(:,:)-B(1,:,:);:imshow(C); 
end 
vo RIRE LER BJ ZK TE ECT B 
figure 
for 1=1:9 
subplot(3,3,1),D(:,:)- B(1,:,:); 
imhist(D); 
end 
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3-16 WFE 3-15 的 运行 结 
a) 读 入 的 视频 序列 图 像 b) 序列 中 每 帧 图 像 的 灰 度 直方 图 
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uli 





通过 分 析 例 程 3-15 Hes Rp, WAFARANSA E EC EH ZAR 7] 

(20 视频 序列 图 像 的 差 值 

由 于 视频 序列 相 邻 帧 之 间 基 有 内 容 上 的 相关 性 ， 所 以 将 相 邻 序列 网 像 做 和 兰 ， 可 以 判断 相 
邻 两 帧 图 像 之 间 的 差异 ， 而 这 种 差异 往往 是 由 运动 目标 或 者 是 噪声 干扰 引起 的 。 

例 程 3-16 XE TUBE 9] ELE TH SELL 8] 2: (E ] MATLAB 源 程 序 ， 图 3-17 是 其 运行 






































zh 
例 程 3-16 
K KK K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K FK K K FK K FK K K FK K FK K FK FK K FK K FK 3K K FK K FK K K K K 3K K K K 
% 读 入 视频 序列 的 1 一 9 帧 图 像 ， 并 显示 
for 1=1:9 
% 将 i 从 整 型 变量 变 为 字符 型 
k-int2str(1); 
% 形 成 'ballk.jpg' 的 文件 
kl1=strcat('ball',k,'.jpg'); 
% 读 入 图 像 并 存储 ，i 用 来 表征 存储 的 帧 数 





end 
figure 
% 相 邻 帧 之 间 图 像 做 差 
for 1=1:8 


imshow(D); 
end 
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图 3-17 WFE 3-16 的 运行 结果 
a) 读 入 的 视频 序列 图 像 
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图 3-17 例 程 3-16 — CE) 
b) 相 邻 帧 图 像 的 差 值 


通过 分 析 图 3-17 可 知 ， 通 过 对 视频 序列 中 相 邻 帧 图 像 进行 兰 值 运算 ， 可 以 检测 出 序列 
图 像 中 的 运动 物体 及 其 运动 轨迹 。 


CEE 11553: 51] [| f 4:38 


视频 序列 图 像 的 滤波 主要 分 为 帧 内 小 波 和 帧 间 滤 波 ， 帧 内 滤波 与 本 书 2.10 市 所 讲解 的 
图 像 小 波 原 理 基本 相同 。 本 小 市 主要 讲解 帆 间 滤波， 它 是 充分 利用 各 帧 之 间 的 联系 完成 的 。 
帧 间 平 均 滤 波 是 一 种 最 简单 的 帆 间 涯 波 方 式 ， 它 是 将 连续 的 几 帧 加 在 一 起 ， 然 后 求 其 平 
均值 。 
例 程 3-17 是 帧 间 平 均 滤 波 的 MATLAB 源 程序 ， 其 运行 结果 如 图 3-18 所 示 。 
例 程 3-17 
for 1=1:5 
% 将 i 从 整 型 变量 变 为 字符 型 
k-int2str(1); 
% 形 成 boardk.jpg' 的 文件 
kl1=strcat('board',k,'.jpg'); 
% 读 入 图 像 并 存储 ，i 用 来 表征 存储 的 帧 数 
Bl(1,:,:)=1mread(k!1); 
% 诬 加 椒盐 噪声 
B(1,:,:)2imnoise(B(1,.,:),'salt & pepper',0.05); 
subplot(3,3,1),C(:,:)- B(1,:,:);:imshow(C)); 









































end 
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% 进 行 帆 间 平 均 小 波 ， 并 显示 
figure 
for 1=1:4 
D(:,:,1)=double(B(1,:,:)+B(1+1,:,:))/2; 
subplot(2,2,1) 
imshow(uint8(DY(:,:,1))) 


end 
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b) 
图 3-18 WFE 3-17 的 运行 结果 
a) 添加 噪声 后 的 视频 序列 图 像 b) 帧 间 平 均 滤 波 后 的 结果 


由 图 3-18 可 知 ， 滤 波 后 的 结果 出 现 了 模糊 的 现象 ， 产 生 这 种 现象 的 原因 主要 有 商 反 : 
CD 帧 间 平 均 滤 波 只 是 简单 地 做 平均 运算 ， 平 均 运算 会 对 局 频 噪声 有 一 定 的 揣 制 作用 ， 但 也 
会 产生 模糊 的 现象 ， 在 米 集 视频 序列 图 像 中 ， 由 于 摄像 机 的 移动 而 使 视频 序列 的 背景 
存在 看 移动 现象 。 


3.6 图像 质量 的 评价 


一 幅 数 字 图 像 在 经 过 变换 后 ， 质 量 会 发 生 改 变 。 本 节 主要 从 客观 和 主观 两 个 方面 对 图 像 
进行 评价 。 


CAE 图像 质量 的 客观 评价 


图 像 质 量 的 客观 评价 十 指 采 用 东 个 或 条 些 指定 量 参 数 和 指标 来 摘 述 图 像 的 质量 。 它 在 图 
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像 融 合 、 图 像 压 缩 和 图 像 水 印 等 应 用 中 有 重要 的 价值 ， 是 衡量 不 同 算法 性 能 优 劣 的 一 个 重要 
指标 。 

最 常见 的 图 像 评价 准则 是 峰值 信 品 比 ( PSNR ) 和 均 方 误差 (MSE )。 假 设 f(x,y) 是 
原始 图 像 ，f'(x,y) 是 处 理 以 后 的 图 像 ，M 和 N 分 别 为 图 像 的 列 数 和 行 数 ， 即 图 像 的 分 辨 率 
为 MxN， 则 PSNR 和 MSE 的 定义 为 


PSNR =10xle| Une fn loe 











L3 Mu E , 
MSE = Vo 242, Lf 08») -S y) 


x=] y=1 





其 中 ， fa fuus 分 别 为 灰 度 图 像 的 最 大 值 和 最 小 值 ， 通 第 取 值 为 2353 和 0. 
例 程 3-18 是 计算 两 幅 图 像 的 PSNR fI] MATLAB 程序 。 
例 程 3-18 
function psnr-PSNR(A,B) 
% 功能 : 计算 两 幅 图 像 的 PSNR fH 
Vo 输入 : KERZ A. B 
% 输出 : psnr 的 值 





% 判断 图 像 的 大 小 是 否 一 致 、 是 否 是 一 幅 图 像 
sizeA-size( A);sizeB-size(B); 
if sizeA~=sizeB 
error(' Image A and B are not of the same size") 


end 


if A——B 
error('Images are identical: PSNR has infinite value") 


end 





% 判断 图 像 的 灰 度 值 是 否 在 0 一 255 之 间 
max2 A-max(max(A)); 
max2 B-max(max(B)); 
min2 A-min(min(A)); 


min2 B-min(min(B)); 


if max2 A>255 ||max2_B>255 |min2 A«O0|min2 B<0 
error('input matrices must have values in the interval [0,255 ]") 


end 


% 计算 PSNR 的 值 
error diff-A-B; 
psnr-20*log10(255/(sqrt(mean(mean(error diff.^2))))); 
disp(sprintf'PSNR—-4965.2fdB',psnr)) 
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通过 例 程 3-19, WH PSNR 的 用 途 。 打 开 素 材 资料 中 文件 名 为 bingmayong.bmp 的 图 
像 ， 将 其 转换 为 JPEG 压缩 的 图 像 。 由 于 JPEG 是 有 损 压 缩 ， 压 缩 后 图 像 的 视频 质量 将 有 所 














下 降 ， 可 以 通过 计算 PSNR 进行 衡量 。 > 
例 程 3-19 


K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K K K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK K FK FK K FK K FK K K K K FK K K K 
% 读 入 一 个 BMP 图 像 ， 并 显示 

I-imread('bingmayong.bmp"); 

subplot(1,2,1);subimage(L); 

title'BMP Eg); 


% 将 BMP 图 像 转换 为 PG 图 像 ， 并 显示 
imwrite(l,'bingmayong.jpg','jpg’; 
J=imread('bingmayong.jpg'); 
subplot(1,2,2);subimage(J); 

title JPEG 压缩 后 的 图 像 ); 





% 由 于 JPEG 是 有 损 压 缩 ， 计 算 BMP 图 像 和 JPG 图 像 之 间 的 PSNR 
PSNR(1,J); 
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运行 后 计算 机 输出 : PSNR--66.49dB. 。 压 缩 后 的 图 像 质 量 对 比如 图 3-19 所 示 。 由 于 








PSNR 较 局 《大 于 +36d4B)， 压 缩 后 的 视 党 质量 仍然 比较 好 。 


BMP 图 像 JPEG 压 缩 后 的 图 像 





图 3-19 压缩 后 的 图 像 质 量 对 比 


M PSNR 的 计算 公 陈 可 以 看 出 ， 它 对 图 像 内 部 所 有 的 像素 都 是 平等 对 待 的 。 事 实 上 ， 人 
眼 视 觉 系统 对 于 不 同位 置 的 像素 会 有 不 同 的 视觉 效 末 。 因 此 ， 在 第 用 的 PSNR 基础 上 ， 出 现 
了 很 多 考虑 HVS (Human Visual System) 影响 的 加 权 峰 值 信 噪 比 C WPSNR 2. 
























例 程 3-20 是 一 种 计算 WPSNR 的 MATLAB 产程 序 ， 它 采用 对 比 敏 感度 函数 来 加 权 空 间 
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L1 
例 程 3-20 
KK K K K KK KK K K K K K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K kK K kK K kK kK kK k K 


function f = WPSNR(A,B) 





% 功能 : KHR EE RE UR K ROEIT 2548. R EI] WO VES PA t R RIDU Efi EU 
% 输入 : KERA B “注意 两 幅 图 像 的 灰 度 值 范围 为 0 一 1) 
% 输出 :两 幅 图 像 的 加 权 峰 值 信 品 比 


if A == B 
error('Images are identical: PSNR has infinite value") 


end 


max2 A = max(max(A)); 
max2 B = max(max(B)); 
min2 A = min(min(A)); 
min2 B = min(min(B)); 


if max2_A > 1 | max2 B>1|min2 A«O0|min2 B«0 
error('input matrices must have values in the interval [0,1] 


end 


e—-A-B; 
if nargin-3 
fc-csf, 9$ CSF 的 滤波 器 系数 
else 
fc = varargin {1}; 
end 
ew = filter2(fc, e); % 运用 CSF 的 滤波 误差 


decibels = 20*logl10(1/(sqrt(mean(mean(ew.^2))))); 
f-decibels; 


function fc — csf() 


% 
% 
% 
% 
% 
% 








功能 : 计算 CSF EGDIRTEO IE HVS "BIRDS FEE Zt CSF 
输出 : fo-- CSF 的 滤波 器 系数 
参考 文献 : 

Makoto Miyahara 

"Objective Picture Quality Scale (PQS) for Image Coding" 

IEEE Trans. on Comm., Vol 46, No.9, 1998. 








% 计算 频率 啊 应 矩阵 


Fmat = csfmat; 
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% 采用 FSAMP2 计算 2D 滤波 器 系数 
fc = fsamp2(Fmat); 


0 六 六 六 六 六 六 六 六 六 六 六 六 六 -了 pg AA otetoketetetokeletetokeleletekejeletereje 


function Sa = csffun(u,v) 





% 功能 : 计算 兰 值 图 像 的 空间 频率 加 权 系 数 
% 输入 : u --- 水 平 空域 频率 

% v -E B TK 

vo 输出 : 频率 啊 应 


% Makoto Miyahara 
% | "Objective Picture Quality Scale (PQS) for Image Coding" 
% | IEEE Trans. on Comm., Vol 46, No.9, 1998. 


sigma — 2; 

f= sqrt(u.*u-v.*v); 

w = 2*pi*f/60; 

Sw = ].5*exp(-sigma^2*w^2/2)-exp(-2*sigma^2*w^2/2); 


% 修改 高 频 部 分 

sita = atan(v./(u-eps)); 

bita = 8; 

f0 = 11.13; 

w0 = 2*pi1*f0/60; 

Ow = ( 1 + exp(bita*(w-w0)) * (cos(2*sita))^4) / (1 exp(bita*(w-w0))); 


% 计算 最 终 响应 
Sa-Sw*Ow; 





% 计算 CSF 9i us NAE P 
min f= -20; 
max f- 20; 
step f= 1; 
u-min tstep fmax f, 
v= min fstep f:max f, 
n= length(u); 
Z — zeros(n); 
for i-1:n 
for j-1:n 
Z(ijesffun(u(),v(j);  % 调用 csffun 
end 
end 
Fmat — Z; 
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对 图 像 质 量 进行 客观 评价 的 为 一 种 方法 是 及 用 测试 卡 。 在 测定 电视 的 显示 质量 、 数 人 码 相 
机 和 扫描 仪 的 成 像 质量 时 ， 币 用 不 同 的 标准 测试 卡 来 完成 。 例 如 在 测定 数码 相机 的 分 辨 座 
时 ， 通 常 采 用 专业 的 标准 分 音 座 测试 卡 〈 见 图 3-20) 进行 照相 ， 然 后 利用 配套 软件 对 标准 测 
试 卡 图 像 进行 观 凤 和 计算 ， 可 以 测 出 数码 相机 的 分 辨识 。 











图 3-20 19012233 标准 分 辨 率 测试 卡 





客观 评价 的 特点 是 采用 客观 指标 和 定量 指标 ， 评 价 结 来 原则 上 不 受 人 为 干预 和 影响 ， 但 
由 于 目前 的 定量 参数 还 不 能 或 者 不 完全 能 反映 人 类 视觉 的 本 质 ， 对 图 像 质量 的 客观 评价 指标 
经 第 与 视觉 的 评价 有 偏 莽 ， 其 全 有 时 结论 完全 相反 。 


SAO [到 像 质 量 的 主观 评价 


图 像 质量 的 主观 评价 是 指 采 用 目 视 观察 和 主观 感觉 评 价 图 像 的 质量 。 

主观 评价 的 方法 类 似 于 体操 比赛 的 评分 ， 由 数 名 裁判 组 成 评分 小 组 ， 根 据 规 则 要 求 和 评 
分 标准 对 体操 运动 员 的 比赛 动作 进行 打分 ， 评 分 结 采 取 总 和 或 平均 值 。 有 些 比赛 还 采取 去 抒 
最 高 分 和 最 低 分 的 方法 ， 以 减少 带 有 倾 癌 性 打分 的 影响 。 

图 像 质量 主观 评价 的 “裁判 ”可 以 由 未 经 训练 的 普通 观察 者 来 担任 ， 或 由 专业 图 像 判读 
专家 来 担任 ， 也 可 由 未 经 训练 的 普通 观察 者 和 专业 图 像 判读 员 分 组 进行 评价 。 评 价 时 需要 事 
先 制 定 评分 标准 以 及 评分 规则 ， 然 后 根据 评分 标准 和 规则 进行 分 组 评价 。 

图 像 质量 主观 评价 的 特点 是 主观 性 和 定性 评 ， 评 价 结束 受 人 为 影响 和 干扰 较 多 ， 但 是 由 
于 目前 的 图 像 质 量 客观 评价 指标 和 参数 疝 不 能 完全 反映 主观 视觉 对 图 像 质量 的 评价 ， 所 以 图 
像 质 量 主观 评价 还 是 主导 评价 方法 。 
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本 章 导 读 

在 现实 生活 中 ， 要 交往 一 个 人 ， 首 先 要 了 解 这 个 人 的 特质 一 一 相 貌 和 性 格 。 同 样 ， 在 基 
于 数字 图 像 的 模式 识别 中 ， 也 要 提取 图 像 的 特征 。 对 图 像 特征 的 提取 与 研究 提供 了 一 种 具有 
统计 意义 的 图 像 内 容 表 达 。 

本 章 按 照 由 大 到 小 、 由 和 面 及 扣 的 顺序 对 图 像 特 征 提 取 技 术 进 行 讲解 与 分 析 ， 内 容 安 排 如 
K 4-1. 











表 4-1 第 4 章 内 容 安排 结构 


图 分 类 涉及 章节 
f Ali 图 像 的 不 变 多 

i 42 图 像 的 边缘 检测 

: 43 Harris f AA 


提 
4.1 图 像 的 不 变 阜 


图 像 分 析 中 的 一 个 关键 问题 就 是 如 何 获 得 一 种 有 效 的 图 像 描 述 量 ， 用 一 个 很 小 的 数据 集 
合 束 可 以 代表 图 像 。 由 于 被 识别 的 图 像 与 原 图 像 相 比 一 般 有 很 大 程度 的 失真 ， 如 平移 、 旋 转 
和 其 他 变化 ， 所 以 研究 者 还 希望 该 图 像 描 述 量 对 于 图 像 的 各 种 畸变 不 敏感 。 不 变 拢 
(Invariant Moments, IMg) 是 一 种 高 度 浓 缩 的 图 像 特 征 ， 具 有 平移 、 灰 度 、 尺 度 、 旋 转 不 变 
性 ， 因 此 和 矩 和 和 矩 冰 数 被 广 泛 用 于 图 像 的 模式 识别 、 图 像 分 类 、 目 标识 别 和 场景 分 析 中 。 
M.K.Hu 在 1961 年 首先 提出 不 变 窍 的 概念 ， 并 将 几何 乍 〈Geometric Moments, GMg) 用 于 
图 像 朱 述 ， 但 其 低 阶 几何 窍 与 图 像 的 整体 特征 有 关 ， 不 包含 太 多 的 图 像 细 币 信息， 而 高 阶 几 
何 算 易 受 噪声 影响 ， 因 此 很 难 利用 几何 窍 恢复 图 像 。 


4.1.1 不 变 和 矩 的 基本 原理 


符 在 统计 学 中 表征 随机 量 的 分 布 ， 一 幅 灰 度 图 像 可 以 用 二 维 灰 度 密度 函数 来 表示 ， 因 此 
可 以 用 矩 来 描述 灰 度 图 像 的 特征 。 
一 幅 Mx N 的 数字 图 像 FG) I p+ q JUI m, KRGE ui, 为 






































M N 
ma =X XPS)  pq=0,1,2 


i=] j=l 


uy 79. G-DYG-jOfGjJ ^ pq-012,- 


i=] j=l 


x 
z 
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在 将 mo E UE FER BAKE RR, UI Cio JO 为 图 像 灰 度 质 心 坐 标 ， 那 么 ， 


_ Mio. ~ _ Mho 
=. j = 一 。 
Moo Moo 








,反映 的 是 图 像 的 灰 度 相对 于 其 灰 度 质心 的 分 布 情况 。 可 以 用 几何 矩 来 表示 中 心算 ， 
阶 中 心 矩 与 几何 矩 的 关系 如 下 。 


Loo - A -iYG-JY fy) = Moo 


Lho -32-DG-jYfG.»)-0 


i 0 (i-i) g= n J (x, y) 2m, — XM o 


i=] j=1 


M N 
khi 2 iy G-j) f(x,y) =M; — 2Xm, — yy *2X^mg 


M N 
Hos =X > (i -i) (j- jY f(x,y) =M} 一 3]J71102 -2y^mg 


i=] j=l 








为 了 消除 图 像 比 例 变 化 带 来 的 影响 ， 定 义 规格 化 中 心 矩 如 下 。 


H pq 
u” 00 








1l pq = , (7 = +b p+q=2,3,) 


利用 二 阶 和 三 阶 规格 中 心 矩 可 以 导出 下 面 七 个 不 变 窍 组 (@ 一 @)， 它 们 对 图 像 平移 、 旋 


转 和 比例 变化 时 你 持 不 变 。 





B = Mo + Mo 
= (Mho — 12) + 4m 
B, = (Tho = 373) +3 =) 
B, = (Tho +M) + (ai +) 
B, = (o — 3M2 Xho + MEO +M)? — 301 +1) 1+ 
(35, — o a + 7703 030159 753). — Ohi +7) ] 








HAB 
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© = (Mho — "f )[(7730 + M2 y — (Mhi 十 7703 Y] + 4 ho + 55 1, + 7703 ) 
D, = (315, — o Xho + 755 [Uo + M2 y- (1), 十 7703 Y] t 
(375,5 — 7730 151 + 7193) 3 (739 + M2 y 一 (772; + Moz Y] G 


4.1.2 DIETS 


例 程 4-1 是 来 求解 Hu 的 7 AAEE MATLAB 源 程序 。 
例 程 4-1 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK ÞK K K K K FK K FK K K K K K ÞK K FK FK FK FK FK FK K K K K 2K K K 





function inv m7 = invariable moment(in image) 
% 功能 : 计算 图 像 的 Hu WENDER 

% 输入 : in image-RGB 图 像 

% 输出 : inv_m7- 七 个 不 变 算 


% 将 输入 的 RGB 图 像 转换 为 灰 度 图 像 

image-rgb2gray(in image); 

% 将 图 像 阜 阵 的 数据 类 型 转换 成 双 精 度 型 

image-double(image); 
和 
% 计 算 灰 度 图 像 的 零 阶 几 何 矩 mo 

m00-sum(sum(image)); 

m10=0; 

m01-0; 


[row,col]-size(image); 





for 17 1:row 
for j-1:col 
m10-ml0-i*image(i,j); 
m01-m01-j*image(i,j); 
end 


ul02m10/m00; 
u01-7m01/m00; 





%%0%-- 一 一 -一 -一 一 计算 图 像 的 二 阶 几 何 矩 、 三 阶 几何 矩 -- 一 -一 -一 一 
m20 = 0;m02 = 0;m1 1 = 0;m30 = 0;m12 = 0;m21 = 0;m03 = 6; 
for 1=1:row 

for j=1:col 


m20=m20+^2*image(i,j); 
m02=m02+j^2*image(i,j); 
ml1-ml l-i*j*image(i,j); 
m30-m30-H^3*image(i,j); 
m03-m03-44^3*1mage(,j); 
ml12-7m12-i*j^2*1magec(i1,]); 
m21-m21-i^2*j*1mage(i1,]); 
end 
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end 
%%% 一 -一 一 一 一 计算 图 像 的 二 阶 中 心 逢 、 三 阶 中 心 逢 =- 一 一 一 
y00=m00; 
y10=0; 
y01=0; 
yll=m11-u01*m10; 
y20=m20-u10*m10; 
y02=m02-u01*m01; 
y30—m30-3*u10*m20-42*u10^2*m10; 
y12-2ml12-2*u01*ml1 1-u10*m0242*u01^2*m10; 
y21^2m21-2*u10*ml1 1-u01*m2022*u10^2*m01 ; 
y03—m03-3*u01 *m0242*u01^2*m01 ; 
e i G LE npud 
n20—y20/m00^2; 
n02—-y02/m00^2; 
nl1—-yl11/m00^2; 
n30—y30/m00^2.5; 
n03—y03/m00^2.5; 
n12-y12/m00^2.5; 
n21—y21/m00^2.5; 
eo E G 4A A 
hl = n20 + n02; 
h2 = (n20-n02)^2 + 4*(n11)^2; 
h3 = (n30-3*n12)^2 + (3*n21-n03)^2; 
h4 = (n30+n12)^2 + (n21+n03)^2; 
h5 = (n30-3*n12)*(n307*n12)*((n30*n12)^2-3*(n214-n03)^2)-(3*n21-n03)*(n21-4n03)*(3*(n30*n12)^2- 
(n21+n03)^2); 
h6 = (n20-n02)*((n30+n12)^2-(n21+n03)^2)+4*n1 1*(n30+n12)*(n2 1+n03); 
h7 = (3*n21-n03)*(n30+n12)*((n30+n12)^2-3*(n21+n03)^2) +3 *n12-n30)* (n2 1+n03)*(3*(n30+n12)^ 
2-(n21+n03)^2); 


inv m7- [hl h2 h3 h4 h5 ho h7]; 


KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K ÞK K K K K K K K K K K K ÞK K FK FK FK FK FK FK FK K K K K K K K 


4.2 图 像 的 边 绿 检测 


图 像 的 边缘 是 指 其 周围 像素 灰 度 急剧 变化 的 那些 像素 的 集合 ， 它 是 图 像 最 基本 的 特征 。 
边缘 存在 于 日 标 、 背 景 和 区 域 之 间 ， 所 以 ， 它 是 图 像 分 割 所 依赖 的 最 重要 的 依据 。 由 于 边 毕 
是 位 置 的 标记 ， 对 灰 度 的 变化 不 敏感 ， 因 此 ， 边 缘 也 是 图 像 史 配 的 重要 特征 。 

边缘 检测 的 基本 思想 是 先 检测 图 像 中 的 边缘 点 ， 再 按照 条 种 全 上 略 将 边缘 点 连接 成 轮 亡 ， 
从 而 构成 分 割 区 域 。 由 于 边缘 是 所 要 提取 目标 和 背景 的 分 界线 ， 拓 取出 边缘 才能 将 目标 和 藻 
景区 分 开 ， 因 此 边缘 检测 对 于 数字 图 像 处 理 十 分 重要 。 

边缘 大 致 可 以 分 为 两 种 : 一 种 是 阶 跃 状 边 缘 ， 边 缘 两 边 像素 的 灰 度 值 明 显 不 同 ， 另 一 种 
为 屋顶 状 边 缘 ， 边 缘 处 于 灰 度 值 由 小 到 大 再 到 小 变化 的 转折 点 处 。 在 图 4-1 中 ， 第 1 行 是 一 
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IS FUGA ES NDA. T8 2 TERREA 1 个 剖面 图 ， 第 3 行 和 第 4 行 分 别 为 章 
面 的 一 阶 和 三 阶 导 数 。 第 1 列 和 第 2 列 是 阶梯 状 边 缘 ， 第 3 列 是 脉冲 状 边缘 ， 第 4 列 是 屋顶 
状 边缘 。 








阶 微 分 边缘 算 子 也 称 梯度 边缘 和 握 子 ， 它 是 利用 图 像 在 边缘 处 的 阶 跃 性 ， 即 图 像 梯度 在 
边缘 取得 极 大 值 的 特性 进行 边缘 检测 的 。 樟 度 是 一 个 天 量 ， 它 共有 方 同 0 MJA |: 








Al = (4-1) 


eda] -er 
0 — arctan(/, / T.) 
RE BASEL A Ne DE T XR um E dS RERA I] pe Dt DF X2SRH SMS KAE 
Jj I] 825 dale ECT 2T 73 In] « 
在 实际 使 用 中 ， 通 常 利 用 有 限 差分 进行 梯度 近似 。 对 于 式 〈(4-1)〉 的 标 度 矢量， 有 
ol 2g 10082) - Tx. y) 




















Óx h—0 Ax 
0D Lg 06 * A») P y) 
Qy h—0 Ay 
它 的 有 限 关 分 近似 为 

aier sedes (Ax — 1) 

Ox 

Ji 

Gy ^ Tere D - sy) (Ay — 1) 





对 于 如 图 4-2 PTRK 3x 3 FRP CRICRI RE HUBRPERIUDEE F HEIE. 


9. - M, = (a, t cda, + 44) — (ag + ca; ta) 
X 
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$7 M, = (a, + ca; + d4) - (ag + ca ta) 


边缘 梯度 





图 4-2 ” 3x3 模板 与 梯度 计算 例子 








参数 c 为 加 权 系 数 ， 表 示 离 中 心 像 元 较 近 。 对 于 c=1 的 情况 ， 束 可 以 得 到 Prewitt 边缘 


检测 郑 积 核 : 
-] 0 +I -] -1 -I 
m,-|-] 0 +l m,=|0 0 0 
-] 0 +i 4] 41 +l 
对 于 加 权 系 数 c=2， 就 可 以 得 到 Sobel 边缘 检测 卷 积 核 : 
-] 0 +l -] -2 -1 
m, =|-2 0 42 m,=| 0 0 0 
-] 0 +l 4] +2 +l 


此 外 ， 在 MATLAB 中 ， 也 提供 了 相关 的 图 像 边 绿 检 训 的 函数 ， 其 调用 格式 如 下 。 


BW = edge(I,'sobel',thresh,direction) 
BW = edge(I,'prewitt',thresh,direction) 
BW = edge(I,'roberts',thresh) 


其 中 , I 是 输入 的 灰 度 图 像 ，thresh E, direction 是 方 问 。 








二 阶 微分 边缘 检测 算 子 是 利用 图 像 在 边缘 处 的 阶 跃 性 导致 图 像 二 阶 微分 在 边缘 处 出 现 零 


值 这 一 特性 进行 边缘 检测 的 ， 因 此 ， 该 方法 也 称 过 零点 算 子 和 拉 普 拉 斯 算 子 。 
对 图 像 的 二 阶 微分 可 以 用 拉 普 拉 斯 算 子 来 表示 : 

OI eI 
一 -一 十 一 一 

OX ex Qy - 








VvV’J = 
对 V27 的 近似 为 


AEE E m 
"E (i, j * 1) - 2, J) - I, j - 1) 


2 


-IC+LD-207DHTG-LD 
了 


VI --A(, j) * IG, j 1) 1G, j 1) * IG lj) 1G 1, j) 
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对 于 如 图 4-2 PRAI 3x3 范围 的 像 元 ， 中 心 像 元 的 Y7 可 近似 为 
V^I « 4a, - (a, +a, +a; +a) 


其 二 阶 微分 模板 为 : e 


0 1 0 
m=|1 4 1 
0 1 0 


虽然 使 用 二 阶 微 分 算 子 检 测 边缘 的 方法 简单 ， 但 它 对 唆 声 十 分 敏感 ， 同 时 也 没有 能 够 提 
供 边 缘 的 方 癌 信息 。 为 了 实现 对 噪声 的 抑制 ，Marr 等 提出 了 高 斯 拉 普 拉 斯 (Laplacian of 
Gaussian, LOG) 的 方法 。 

为 了 减少 噪声 对 边缘 的 影响 ， 首 先 要 对 网 像 进行 低 通 滤波 平 请 ，LOG 方法 采用 了 局 时 
浮 数 作为 低 通 滤波 器 。 局 斯 疯 数 为 














G(x,y)-e d 
AP, e 决定 了 图 像 的 平滑 程度 。 电 斯 函数 生成 的 滤波 模板 尺寸 一 般 设 定 为 6a 。 使 用 
局 斯 函数 对 图 像 进 行 小 波 并 对 图 像 小 波 后 的 结果 进行 二 阶 微 分 运算 的 过 程 ， 可 以 转换 为 先 对 
局 斯 函数 进行 二 阶 微分 ， 再 利用 高 斯 函数 的 二 阶 微分 结果 对 图 像 进 行 知 积 运 算 ， 该 过 程 可 用 
如 下 数学 公式 表示 。 














Vi [T(x,y)® G(x,y)]=V° G(x,y)® I(x, y) 
2 2 ; > 
vaen [E Je /20 r? — y? iy 
O 


研究 表明 ，YV*G(x,y) 比较 符合 人 的 视觉 特性 。 
在 实际 应 用 中 ， 可 将 V*G(x,y) 简化 为 





Xx y^ 


2 2 
V^G(x, y) - «2-2 ubi ] 2d 
O 








在 参数 设计 中 ，o PARAK, ETRE RZ: oh, WD TEE. WMR 
据 图 像 的 特点 并 通过 实验 选择 合适 的 ao。 VG, y) H N xN 模板 算 子 表示 时 ， 一 般 选 择 算 
TORGEAN 2 —4WW . K PERVER FETU ERN HIERA ELMAN. 

在 这 里 ， 检 测 边 界 就 是 V*G(x,y) 的 过 零点 ， 可 用 以 下 几 种 参数 表示 过 零点 出 灰 度 变化 
的 速率 。 

> 过 零点 处 的 料 率 。 

> 二 次 币 分 峰 - 峰 产值 。 

> 二 次 微分 峰 - 峰 间 曲 线 下 面积 绝对 值 之 和 。 

边界 点 方 癌 信息 可 由 梯度 复 子 给 出 。 为 减 小 计算 量 ， 在 使 用 中 可 用 局 斯 兰 分 算 子 






































(DOG ): 
1 x+y? 1 x+y? 
DOG(o,,0,)2———e ?一 e 2€ 
SI) v 2110, N 210, 
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代替 V? G(x, y) 。 
利用 LOG 算 子 进行 边缘 检测 的 步骤 如 下 。 
D 用 拉 普 拉 斯 高 斯 滤波 句 对 图 像 滤波 ， 得 到 滤波 图 像 。 
2) 对 得 到 的 图 像 进行 过 零 检 测 ， 有 基体 方法 为 : 假定 得 到 的 图 像 的 一 阶 微分 图 像 的 每 个 


ERN Pij] Lp5,J]l. Ad bna. P HLE 
义 如 图 4-3 所 示 。 

接 下 来 按照 下 面 的 规则 进行 判断 。 

> WRLL5j-o. WEZ Gp -1, j], Lli +1, jI) 











ak (L[i, j 1], Lli j +1) 中 是 否 包 含 正 负 号 相反 
的 两 个 数 。 只 要 这 两 个 数 中 有 一 个 包含 正 负 号 
TH bc BS] PA AS ZA, HU) PD, j] ERF. RA Je (LE j-1], Lp. jb 
Pli, j] E NL BS — Br 25 4; fH oe GA Y — E B Bd 

W WREE M PE, 刀 征 边缘 点 ， 人 否则 不 古 。 








图 4-3 LOG 算 子 过 零 检 测 示 意图 





> WURL[,j]4 2g. WE 4NA QU, 7]; LB] QA 7]; LU +1, jD, Ei, 7]; Li, j 7 1]. 





(E, ji Li, j +D) 中 是 否 有 包含 正 负 号 相反 的 值 。 如 果 有 ， 那 么 在 PH jA 
越 。 看 Pli, 有] 对 应 的 一 阶 差分 值 是 否 大 于 一 定 的 六 值 ， 如 果 是 ， 则 将 PE, 力作 为 边 
缘 点 。 





例 程 4-2 是 实现 LOG 算 子 检测 边缘 的 MATLAB 源 程 序 代 码 ， 其 运行 过 程 如 网 4-4a 所 








示 ， 运 行 结果 如 网 4-4b 所 示 。 
例 程 4-2 





K KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K FK K K FK K FK K K FK K FK K FK FK K FK K FK FK K FK ÞK FK FK K FK K FK K K K K K K K K 
function e=log edge(a, sigma) 

% 功 能 : 实现 LOG 算 子 提取 边缘 点 

% 输 入 : a- 灰 度 图 像 

% sigma-J5 3X AAZ 

% 输 出 : e- 边 缘 图 像 


% 产 生 同 样 大 小 的 边缘 图 像 e， 初 始 化 为 0. 

[m,n |-size(a); 

e-repmat(logical(uint8(0)),m,n); 

rr-2:m-1;cc—2:n-1; 

9/0395 E RRO 8 2C] Ven HI] Jw fsize>6*sigma; 
fsize-ceil(sigma*3)*2-41; 

% 产 生 LoG 滤波 器 

op-fspecial ('log'fsize,sigma) ; 

% 将 LoG 滤波 右 的 均值 变 为 0. 
op=op-sum(op(:))/prod(size(op)); 

% 利 用 LoG 算 子 对 图 像 洲 小 

b-filter2(op,a); 

% 设 置 过 零 检 测 的 门限 

% 寻 找 滤波 后 的 过 零点 ，+- 和 -+ 表示 水 平方 同 从 左 到 在 和 从 右 到 雹 过 和 夫 
%[+-] 和 [-+] 雪 示 垂 直方 向 从 上 到 下 和 从 下 到 上 过 和 零 
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WX ERA 1326 95301 EC 5329 TELAM 1 E) 3 
thresh-.75*mean2(abs(b(rr,cc))); 
%[- +] 的 情况 
[rx,cx |-find(b(rr,cc)«O&b(rr,cc7-1)» 0&abs(b(rr,cc)-b(rr,cc--1))»thresh) | 
e((rx--1)*cx*m)-1; > 
%[- +] 的 情况 
[rx,cx |-find(b(rr,ec-1)» 0& b(rr,cc)«0&abs(b(rr,cc-1)-b(rr,cc))^thresh) 
e((rx-1)*cx*m)-1; 
%[- +] 的 情况 
[rx,cx |-find(b(rr,cc)«O&b(rr-1,cc)» 0&abs(b(rr,cc)-b(rr1,cc))»thresh) 
e((rx--1)*cx*m)-1; 
%[- +] 的 情况 
[rx,cx |-find(b(rr-1,cc)» 0& b(rr,cc)«0&abs(b(rr-1,cc)-b(rr,cc))^thresh) 
e((rx--1)*cx*m)-1; 
% 茶 些 情况 下 LoG 滤波 结果 可 能 正好 为 0， 下 面 考虑 这 种 情况 : 

9o dE BUR ILE 
%+0- 和 和 -0+ 表示 水 平方 向 从 左 到 右 和 从 右 到 左 过 零 
%[+0-] 和 [-0+] 表 示 垂 直方 向 从 上 到 下 和 从 下 到 上 过 和 雪 
% 人 边缘 正好 位 于 滤波 值 为 零点 上 
[rz,cz]=find(b(rr,cc)}==0); 
if~isempty(rz) 
% 零 点 的 线性 坐标 
Zero-(rzt1)*cz*m; 
%[-0+] 的 情况 
zz—-find(b(zero-1)«0&b(zero-7-1)»0&abs(b(zero-1)-b(zero--1))»2*thresh); 
e(zero(zz))-1; 
%[+0-] 的 情况 
zz=find(b(zero-1)>0&b(zero+1)<0&abs(b(zero-1)-b(zero+1))>2*thresh); 
e(zero(zz))-1; 
%[-0+] 的 情况 
zz=find(b(zero-m)<0&b(zero+tm)>0&abs(b(zero-1)-b(zero+1))>2*thresh); 
e(zero(zz))-1; 
%[+0-] 的 情况 
zz=find(b(zero-m)>0&b(zero+tm)<0&abs(b(zero-1)-b(zero+1))>2*thresh); 
e(zero(zz))-1; 
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end 
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a-imread('huaB. jpg’); 
a-rgb2gray (a); 
e=log_edge (a, 0. 25) ; 
subplot (1, 2, 1), imshow Ía) : 
subplot (1,2, 2), imshow íe) ; 
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b 
Kl4-4 p M 及 其 运行 结 
a) 运行 过 程 b) 运行 结果 
JES, Æ MATLAB 中 ， 也 提供 了 相关 的 网 像 边缘 检测 的 函数 ， 其 调用 格式 如 下 。 
BW = edge(L'log',thresh) 
HB, I 是 输入 的 灰 度 图 像 ，thresh Æ BE. 





PAM 基于 Canny 算 子 检测 图 像 边缘 


Canny 边缘 检测 算 子 是 边缘 检测 算 子 中 最 种 用 的 一 种 ， 也 是 公认 的 性 能 优 民 的 边缘 检测 





算 子 ， 它 经 香 被 其 他 算 子 引用 作为 标准 算 子 进行 优 劣 的 对 比分 析 。Canny 提出 了 边缘 检测 算 
子 优 劣 评判 的 三 条 标准 。 
> 高 的 检测 率 。 边 缘 检 测算 子 应 该 只 对 边缘 进行 啊 应 ， 检 测算 子 不 漏 检 任何 边缘 ， 也 
不 应 将 非 边缘 标记 为 边缘 。 

> 精确 的 定位 。 检 测 到 的 边缘 与 实际 边缘 之 间 的 距离 要 尽 可 能 小 。 

> 明确 的 啊 应 。 对 每 一 条 边缘 只 有 一 次 啊 应 ， 只 得 到 一 个 点 。 

Canny 边缘 检测 算 子 能 满足 上 述 三 条 评判 标准 ， 这 也 正 是 其 优秀 之 处 。 虽 然 Canny AT 
也 是 一 阶 微分 算 子 ， 但 它 对 一 阶 微分 算 子 进行 了 扩展 ， 即 主要 是 在 原 一 阶 微分 算 子 的 基础 
上 ， 增 加 了 非 最 大 值 抑 制 和 双 冰 值 两 项 改进 。 利 用 非 最 大 值 抑制 不 仅 可 以 有 效 地 抑制 多 啊 应 
边缘 ， 而 且 还 可 以 提高 边缘 的 定位 精度 ;利用 双 浆 值 可 以 有 效 减少 边缘 的 漏 检 率 。 

利用 Canny 算 子 进行 边缘 提取 主要 分 四 步 进行 : 

(1) 去 噪声 

通 各 使 用 高 斯 郴 数 对 图 像 进 行 平 滑 滤 波 。 为 了 提高 运算 效率 ， 可 以 将 高 斯 函数 作成 滤波 
模板 ， 如 使 用 5x5 的 模板 (oo =1.4 ): 
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(2) 计算 梯度 值 与 方 同 角 
分 别 求 取 去 噪声 后 图 像 的 在 x 方向 和 y 方向 的 梯度 M, 和 M,。 求 取 梯 度 可 以 通过 使 用 
前 面 的 Sobel 模板 与 图 像 进行 郑 积 完成 : 


-] 0 +l =l 2 | 
-2 0 +2|, m, =|0 0 0 
-] 0 +l +1 +2 +l 


- 2 2 
Af EM? M? 











m. — 





PIEN : 


BEBE TIR BE: 
Ó — arctan( M, / M.) 


将 0? —360^ 梯度 方向 角 归 并 为 四 个 方向 0': 0^, 45°, 90^ 和 135”。 对 于 所 有 边缘 ， 
定义 180^ =0”，225° -45^ 等 ， 这 样 ， 方 同 角 在 [-22.5”~22.5° ] 和 [157.5"” —202.5^ JW HL EJ 
的 角 点 都 被 归并 到 0° 方 回 角 ， 其 他 的 角度 归并 以 此 类 推 。 

(3) 非 最 大 值 抑制 

根据 Cany 关于 边缘 算 子 性 能 的 评价 标准 ， 边 缘 只 允许 有 一 个 像 元 的 宽度 ， 但 经 过 
Sobel 滤波 后 ， 图 像 中 的 边缘 是 粗细 不 一 的 。 边 缘 的 粗细 主要 取决 于 跨越 边缘 的 密度 分 布 和 
使 用 高 斯 泪 激 后 网 像 的 模糊 程度 。 非 最 大 值 抑制 殉 是 将 那些 在 梯度 方向 具有 最 大 梯度 值 的 像 
元 作为 边缘 像 元 保留 ， 将 其 他 像 元 删除 。 梯 上 度 最 大 值 通常 是 出 现在 边缘 的 中 心 ， 随 看 沿 桂 虑 
方 同 距 离 的 增加 ， 梯 上 度 值 将 随 之 减 小 。 

这 样 ， 结 合 在 上 一 步 得 到 的 每 个 像 元 的 梯度 值 和 方 品 角 ， 检 查 围 绕 点 (x,y) 89 3x 3 TG Hl 
内 的 像 元 : 

> 如 果 0'(x,y)=0 ， 那 么 ， 检 查 像 元 (x+1,y)、(x,y) 和 (x 一 1,y)。 

> 如 果 0'(x,y)=90" ， 那 么 ， 检 查 像 元 (x,y+1)、(x,y) 和 (x,y 一 1)。 

> WO xy) -45,. WA, REBRI (x+, y+1); (x,y) M(x-1,y-1)- 

> WR O'(x,y)=135, WA, REBRI (x+, y-1)~ (x,y) M (x-1, y+1)- 

比较 被 检查 的 三 个 像 元 梯度 值 的 大 小 ， 如 果 点 (x,y) 的 梯度 值 都 大 于 其 他 两 个 点 的 梯度 
值 ， 那 么 ， 点 (x,y) 驶 被 认为 是 边缘 中 心 点 并 被 标记 为 边缘 ， 否 则 ， 点 (x,J) 束 不 被 认为 是 边 
缘 中 心 点 而 被 删除 。 

(4) Fia BEM 

HFEA, Aa MAMAE a MR IRIS. dr REM V EAA 
BOE: — US LE bieno 7 MIB how o WMREATR RI AAA T E re E, 
KARRU JM MRE CARRELA 的 像素 ， 如 果 与 已 经 标 为 边缘 的 像 
zs 4- 邻 接 或 8- 邻 接 ， 则 将 这 些 像素 也 标记 为 边缘 。 这 个 过 程 反 复 迭 代 ， 将 剩 下 的 孤立 的 响应 
超过 低 浆 值 的 像素 则 视 为 噪声 ， 不 再 标记 为 边缘 。 有 基体 过 程 如 下 。 

1) 如 果 像 元 的 梯度 值 小 于 二 ， 则 像 元 (x,y) 为 非 边缘 像 元 。 

2) 如 果 像 元 (x,y) 的 梯度 值 大 于 WRI (x, y) 为 边缘 像 元 。 
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3 ) 如 果 像 元 (x,y) 的 梯度 值 在 t, 与 tiw 之 间 ， 需 要 进一步 检查 像 元 (x,y) 8] 3x 3 邻 
域 ， 看 3x3 邻 域 内 像 元 的 梯度 是 否 大 于 hs ， 如 果 大 于 hs WAT (x, y) 为 边缘 像 元 。 

4) 如 果 在 像 元 (x,y) 的 3x3 邻 域内 ， 没 有 像 元 的 梯度 值 大 于 hig, ^. E293. XR TL Hl 
到 5x5 邻 域 ， 看 在 5x5 邻 域内 的 像 元 是 否 存在 梯度 大 于 tisp WRA, MEI x,y) 为 边缘 
像 元 〈 这 一 步 可 选 ); 否则 ， 像 元 (*,J) 为 非 边缘 像 元 。 

在 第 三 步 的 非 最 大 值 抑制 过 程 中 ， 上 述 方法 采用 了 近似 计算 : 将 当前 像 元 的 梯度 方向 近 
似 为 4 个 方向 ， 然 后 ， 将 梯度 方 各 对 应 到 以 当前 点 为 中 心 的 3x3 邻 域 上 ， 然 后 ， 通 过 邻 域 上 
对 角 线 方 癌 三 个 像 元 梯度 值 的 大 小 比较 ， 判 断 是 否 为 边缘 点 。 这 一 近似 方法 的 优点 是 计算 速 
度 快 ， 但 精度 较 差 。 为 提高 精度 ， 可 以 采用 双 线 性 插值 方法 求 取 当 前 点 在 梯度 方向 上 两 边 点 
的 梯度 值 ， 然 后 ， 再 进行 梯度 值 的 比较 ， 以 确定 当前 点 是 否 为 边缘 点 。 

在 MATLAB 中 ， 也 提供 了 相关 的 图 像 边缘 检测 的 函数 ， 其 调用 格式 如 下 。 


BW = edge(I,'canny',thresh) 


其 中 , I 是 输入 的 灰 度 图 像 ，thresh 1E. 
例 程 4-3 是 调用 edge( ) 函 数 ， 对 输入 网 像 进行 边缘 检测 的 MATLAB 程序 ， 其 运行 结 
如 图 4-5 所 示 。 
例 程 4-3 
KOK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 
% 读 入 图 像 
I = imread('circuit.tif)); 
% 进行 边缘 检测 
BW1=edge(L'canny ); 
% 显示 结 
subplot( 1,2,1),1mshow!(]); 
subplot(1,2,2),1mshow(BWl1); 
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图 4-5 例 程 4-3 的 运行 结 


加 基于 SUSAN 特征 检测 算 子 的 边缘 提取 


SUSAN 又 称 最 小 核 值 相似 区 ， 是 Smallest Univalue Segment Assimilating Nucleus Hig 
写 ， 是 由 牛津 大 学 的 Smith. 等 人 提出 的 。SUSAN 使 用 一 个 原型 模板 和 一 个 圆 的 中 心 点 ， 通 
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过 圆 中 心 点 像 元 值 与 模板 圆 内 其 他 像 元 值 的 比较 ， 统 计 出 与 圆 中 心 点 像 元 值 近似 的 像 元 数 
量 ， 并 与 所 设 定 的 国 值 进行 比较 ， 以 确定 是 否 是 边缘 。 

定义 一 个 半径 为 3.4 个 像 元 的 圆 ， 对 于 离散 网 像 而 言 ， 这 个 圆 共 有 37 个 像 元 。 圆 的 中 
心 像 元 称 为 模板 的 核 (Nucleus)， 如 图 4-6 所 示 ， 粗 线 包围 的 区 域 为 离散 圆 。 > 

在 模板 圆 内 ， 将 与 模板 核 像 元 值 相似 的 像 元 数量 或 面积 称 为 核 值 相似 区 CUnivalue 
Segment Assimilating Nuceleus，USAN) 面积， 如 图 4-7 所 示 ， 当 模板 圆 在 典型 图 像 上 移动 
时 ， 在 圆 内 ，USAN 面积 是 完全 不 同 的 。 当 圆 形 模 板 完 全 处 在 图 像 或 背景 中 时 ，USAN KER 
面积 最 大 ;， 当 模板 移 向 图 像 边缘 时 ，USAN 区 域 逐 渐变 小 ， 当 模板 中 心 处 于 边缘 时 ，USAN 
区 域 很 小 ， 当 模板 中 心 处 于 角 点 时 ，USAN 区 域 最 小 。 可 以 看 出 ， 在 边缘 处 像素 的 USAN fü 
都 小 于 或 等 于 其 最 大 值 的 12。 因 此 ， 计 算 图 像 中 每 一 个 像素 的 USAN 值 ， 通 过 设 定 一 个 
USAN 阀 值 ， 查 找 小 于 阀 值 的 像素 点 ， 即 可 确定 为 边缘 点 。 



































图 4-6 SUSAN 模板 离散 圆 与 核 图 4-7 模型 和 模板 核 在 典型 图 像 的 不 同位 置 的 USAN 变化 


将 圆 形 模板 在 被 检测 的 图 像 上 逐个 像 元 移动 ， 圆 形 模板 内 的 像 元 值 与 核 像 元 值 进 行 比 
较 。 比 较 过 程 可 用 下 式 进 行 摘 述 。 
A FR rr) Cr) 
c(r,r.)- 
” 06 WRI) -IC ) 
HP, ndo BUE ERP E; r 表示 模板 内 其 他 任意 位 置 ，J(x,) 表 示 图 像 在 
ro 处 的 像 元 值 ; 7 六) 表示 图 像 在 r 处 的 像 元 值 ; :为 像 元 与 其 他 像 元 相似 度 的 浆 值 。 当 模板 圆 
内 的 所 有 像 元 比较 完成 后 ， 对 结果 c(x,ro) 进 行 累加 ， 即 
n(r,) - > CGr.r) 


n(r,) 就 是 模板 核 在 ro 处 模板 内 图 像 USAN 的 像 元 数量 ， 也 即 是 模板 核 在 rn? 处 图 像 
USAN 的 面积 。 

得 到 每 个 像素 的 USAN 值 n(x,) 以 后 ， 再 与 预先 设 定 得 门限 g 进行 比较 ， 当 mo)<eg 时 ， 
所 检测 到 像素 位 置 x, 可 以 认为 是 一 个 边缘 点 。 

对 于 数字 图 像 ， 实 际 上 无 法 实现 真正 的 圆 形 模 板 ， 所 以 都 是 采用 近似 圆 代 蔡 。 但 当 模 板 
较 小 时 ， 如 果 门 限 选 取 不 恰当 ， 可 能 会 发 生 边 缘 点 漏 检 的 情况 。 模 板 也 不 宜 取 得 太 大 ， 否 则 
会 增 大 运算 量 大 ， 通 常 可 取 5x5 或 37 像素 模板 。 

门限 g 决定 了 边缘 点 的 USAN 区 域 的 最 大 值 ， 即 只 要 图 像 中 的 像素 的 USAN 值 小 于 g， 
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该 点 就 被 判定 为 边缘 点 。g 过 大 时 ， 边 缘 点 附近 的 像素 可 能 作为 边缘 被 提取 出 来 ， 过 小 则 会 
漏 检 部 分 边缘 点 。g 取 0.75xm FE Cn, 为 模板 的 最 大 USAN 值 ) 可 以 较 好 地 提取 出 图 像 
中 的 边缘 点 。 

门限 t 表示 所 能 检测 边缘 点 的 最 小 对 比 度 ， 也 是 能 忽略 的 噪声 的 最 大 容 限 。; 越 小 ， 可 从 
对 比 度 越 低 的 图 像 中 提取 特征 。 因 此 对 于 不 同 对 比 度 和 噪声 情况 的 图 像 ， 应 取 不 同 的 1 值 。 

例 程 4-4 的 功能 是 实现 运用 SUNSAN 算 子 进行 边缘 检测 。 

例 程 4-4 
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function image_out = susan(im,threshold) 

% 功能 : 实现 运用 SUNSAN 算 子 进行 边缘 检测 
% 输入 : image_in- 输 入 的 竺 检测 的 图 像 

% threshold- Bi] [E 

% 输出 : image_out- 检 测 边 缘 出 的 二 值 图 像 


% 将 输入 的 图 像 矩 阵 转换 成 double 型 
d= length(size(1m)); 
if d==3 

image-double(rgb2gray(im)); 
elseif d==2 

image=double(im); 
end 


% f£ SUSAN 模板 
mask=([0011100;0111110;1111111;1111111;1111111;0111110;0011100); 
R-zeros(size(1image)); 
% 定义 USAN 区 域 
nmax = 3*37/4; 
[a b]-size(1mage); 
new-zeros(a-4-7,b-4-7); 
[c d]-»size(new); 
new(4:c-4,4:d-4)-image; 
for 1=4:c-4 


for ]=4:d-4 


current 1mage = new(1-3:1+3,J-3:]+3); 


current masked image = mask.*current image; 
% ”调用 susan threshold p Zi ET] Bü [Hi EG Be KE PE 


current thresholded = susan threshold(current masked image,threshold); 
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g-sum(current thresholdedq(:)); 


if nmax«g 
R(1,j) = g-nmax; y 
else > 
R(1j) = 0; 
end 


end 
end 


image out-R(4:c-4,4:d-4); 
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例 程 4-5 所 调用 的 子 函 数 susan threshold 的 MATLAB 源 代 码 如 下 所 示 。 
例 程 4-5 
米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 米 


function thresholded = susan threshold(image,threshold) 
% 功能 : WE SUSAN 算法 的 阔 值 


[a b|-size(image); 
intensity center = image((a*-1)/2,(b--1)/2); 


templ = (image-intensity center)/threshold; 
temp2 = templ.^6; 
thresholded = exp(-1*temp2); 


LRLEELLELLELLLLLLLLLLLLLLLELLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL 


例 程 4-4 和 例 程 4-5 的 运行 结果 如 图 4-8 所 示 。 





a) b) 
图 4-8 IFE 4-4, 4-5 的 运行 结果 
a) 原始 图 像 b) 采用 SUSAN 算 子 检测 边缘 的 结 


基于 SUSAN 算 子 的 边缘 检测 有 如 下 优 恨 性 能 。 

(1) 抗 噪声 能 力 好 

由 于 USAN 的 求 和 相当 于 求 积分 ， 所 以 这 种 算法 对 噪声 不 敏感 ， 而 且 SUSAN 算法 不 涉 
及 梯度 的 计算 ， 所 以 该 算法 抗 噪声 的 性 能 很 好 。 很 明显 ， 如 果 考 虑 有 独立 同 分 布 的 高 斯 噪 
声 ， 只 要 噪声 小 于 USAN 函数 的 相似 灰 度 门限 值 ， 品 声 束 可 被 急 略 。 对 局 部 突变 的 孤立 噪 
声 ， 即 使 噪声 的 灰 度 与 核 相似 ， 只 要 局 部 USAN 值 小 于 门限 g， 也 不 会 对 边缘 检测 造成 影 
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啊 。 因 此 SUSAN 边缘 检测 算法 可 以 用 于 被 噪声 污染 的 图 像 的 边缘 检测 。 

(2) 算法 使 用 灵活 

由 于 基于 SUSAN 算法 的 边缘 检测 使 用 了 控制 参数 t 和 g， 因 而 ， 可 以 根据 具体 情况 很 
容易 地 对 不 同 对 比 度 、 不 同形 状 的 图 像 通过 设置 恰当 的 上 和 g 来 进行 控制 。 例 如 ， 图 像 的 对 
比 度 较 大 ， 则 可 选取 较 大 的 t 值 ， 而 图 像 的 对 比 度 较 小 ， 则 可 选取 较 小 的 t 值 。 所 以 这 种 算 
法 非常 适用 于 对 某 些 低 对 比 度 图 像 或 目标 的 识别 。 

(3) 运算 量 小 ， 速 度 快 

对 一 幅 256x256 的 图 像 ， 应 用 SUSAN 算法 进行 计算 ， 对 每 一 点 只 需 做 8 次 加 法 运 
4L, Jine 256x256x8 次 加 法 。 而 对 于 其 他 的 经 典 的 边缘 检测 算法 ， 如 条 采 用 欧式 距离 
作为 梯度 算 子 ，Sobel SEG ACHIWiA 3x3 的 模板 ， 对 每 一 点 需要 做 9 UA. 6 次 乘法 ， 以 
及 1 次 开 方 运算 ， 则 共 需 要 做 256x256x9 次 加 法 运算 和 256x256x6 次 乘法 运算 ， 以 及 
256x256 次 开 方 运算 。 采 用 Gauss-Laplace 算 子 、Priwitt 算 子 以 及 Canny 算 子 进行 边缘 检测 
的 计算 量 就 会 更 大 。 

(4) 可 以 检测 边缘 的 方向 信息 

SUSAN 算法 可 以 检测 出 边缘 的 方向 信息 。 有 具体 思想 是 : 对 每 一 个 检测 点 计算 模板 内 与 
该 点 灰 度 相似 的 像素 集合 的 重心 ， 检 测 点 与 该 重心 的 连 线 的 矢量 垂直 于 这 条 边缘 。 
| 经 验 分 享 ， 傅 里 叶 变 换 与 梯度 的 关系 | 

图 像 是 由 对 在 连续 空间 上 的 采样 得 到 一 系列 点 的 集合 ， 用 户 习 惯用 一 个 二 维和 矩阵 
表示 空间 上 各 点 ， 则 图 像 可 由 z=f (x,y) 来 表示 。 由 于 空间 是 三 维 的 ， 图 像 是 二 维 的 ， 因 
此 ， 空 间 中 物体 在 另 一 个 维度 上 的 关系 就 由 梯度 来 表示 ， 这 样 就 可 以 通过 观察 图 像 得 
知 物体 在 三 维 空间 中 的 对 应 关系 。 为 什么 要 提 梯 度 呢 ? 因为 实际 上 对 图 像 进 行 二 维 傅 
里 叶 变 换 得 到 频谱 图 ， 就 是 图 像 梯度 的 分 布 图 ， 当 然 频谱 图 上 的 各 点 与 图 像 上 各 点 并 
不 存在 一 一 对 应 的 关系 ， 即 使 在 不 移 频 的 情况 下 也 一 样 。 在 傅 里 叶 频 谱 图 上 看 到 的 明 
暗 不 一 的 亮点 ， 实 际 上 是 图 像 上 某 一 点 与 邻 域 点 差异 的 强 弱 ， 即 梯度 的 大 小 ， 也 即 该 
点 频 座 的 大 小 (可 以 这 么 理解 ， 图 像 中 的 低频 部 分 指 低 梯度 的 点 ， 高 频 部 分 相反 )。 一 
般 来 讲 ， 梯 度 大 则 该 点 的 亮度 强 ， 否 则 该 点 亮度 弱 。 这 样 通 过 观察 侍 里 叶 变 换 后 的 频 
谱 图 ， 也 叫 功 率 图 。 首 先 就 可 以 看 出 图 像 的 能 量 分 布 : 如 果 频 谱 图 中 上 暗 的 点 数 更 多 ， 
那么 实际 图 像 是 比较 柔和 的 ( 因为 各 点 与 邻 域 差 剧 都 不 大 ， 梯 度 相 对 较 小 ); 反之 ， 如 
果 频 谱 图 中 亮 的 点 数 多 ， 那 么 实际 图 像 一 定 是 失 锐 的 ， 边 界 分 明 且 边界 两 边 像素 差异 
较 大 。 


4.3 Harris 角 点 检测 
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像 的 角 把 。 对 角 点 可 以 从 两 个 不 同 的 角度 定义 : EARED; 二 是 角 点 是 邻 
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从 20 世纪 70 年 代 至 今 ， 许 多 学 者 对 图 像 的 角 点 检测 进行 了 大 量 的 研究 。 这 些 方法 主要 O) 





分 为 两 类 : 基于 图 像 边缘 的 检测 方法 和 基于 图 像 灰 度 的 检测 方法 。 前 者 往往 需要 对 图 像 边缘 
进行 编码 ， 这 在 很 大 程度 上 依赖 于 网 像 的 分 制 和 边缘 提取 ， 有 共有 较 大 的 计算 量 ， 且 一 旦 竺 检 
测 目 标 局 部 发 生变 化 ， 很 可 能 导致 操作 失败 。 早 期 主要 有 Rosenfeld 和 Freeman 等 人 的 方 
法 ， 后 期 有 CCS 等 方法 。 基 于 图 像 灰 度 的 方法 通过 计算 点 的 曲率 及 梯度 来 检测 角 点 ， 避 人 免 
了 第 一 类 方法 存在 的 缺陷 ， 是 目前 研究 的 重点 。 此 类 方法 主要 有 Moravec $t. Forstner 算 
F, Harris 算 子 、SUSAN 算 子 等 。 

评价 角 点 检测 算法 性 能 优 劣 主 要 从 以 下 五 个 方面 来 考虑 。 

> 准确 性 : 即使 很 细小 的 角 点 ， 算 法 也 可 以 检测 到 。 

> 定位 性 : 检测 到 的 角 点 应 尽 可 能 地 接近 它们 在 图 像 中 的 真实 位 置 。 

> 稳定 性 : 对 相同 场景 招 摄 的 多 幅 图 片 ， 每 一 个 角 点 的 位 置 都 不 应 该 移动 。 

> 实时 性 : 角 点 检测 算法 的 计算 量 越 小 、 运 行 速度 越 快 越 好 。 

> EHHE: 对 噪声 具有 抗 干扰 性 。 


ANE Harris 角 点 的 基本 原理 


人 了 眼 对 角 扣 的 识别 通 第 是 在 一 个 局 部 的 小 区 域 或 小 窗口 完成 的 ， 如 图 4-9a 所 示 。 如 
果 在 各 个 方向 上 ， 移 动 这 个 特定 的 小 窗口 ， 窗 口内 区 域 的 灰 度 发 生 了 较 大 的 变化 ， 那 
么 ， 就 认为 在 窗口 内 遇 到 了 角 点 ， 如 图 4-9b 所 示 ; 如 果 这 个 特定 的 窗口 在 图 像 各 个 方向 
上 移动 时 ， 窗 口内 图 像 的 灰 度 没有 发 生变 化 ， 那 么 窗口 内 了 吏 不 存在 角 点 ， 如 图 4-9c 所 
zi: 如 果 窗 口 在 茶 一 个 〈 些 ) 方向 移动 时 ， 窗 口内 图 像 的 灰 度 发 生 了 较 大 的 变化 ， 而 在 
妨 一 些 方向 上 没有 发 生变 化 ， 那 么 ， 窗 口内 的 图 像 可 能 吏 是 一 条 直线 的 线段 ， 如 图 4-9d 
PIE 


















































图 4-9 f LI. fa L1 2) 3 18 s rU 


对 于 图 像 T(x,y) ， 当 在 点 (x,y) 处 平移 (Ax,Ay) 后 的 日 相似 性 可 以 通过 自 相 关 函 数 给 出 : 


c(x, y, Ax, Ay) = > w(u,v Tu,v)— I(u Ax, v + Ay))? (4-2) 
(u,v)eW (x,y) 
AF, W(x,y) EAA Qx, y) 为 中 心 的 窗口 ，w(wu,v) 为 加 权 函 数 ， 它 既 可 以 是 和 常数， 又 可 
以 是 咒 斯 加 权 函 数 ， 如 图 4-10 Pra. 
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图 4-10 ”加权 函数 
a) 常数 加 权 函 数 ”b) 高 斯 加 权 函 数 


根据 泰勒 展开 ， 对 图 像 Ix, y) EFE (Ax, Ay) 后 进行 一 阶 近似 : 
I(u * Ax,v + Ay) & I(u,v) + I (u,v)Ax + I (u, v)Ay 
网 (4-3) 
= [(u,v) * |Z (u,v), I (u,v)| 
y Ay 
RP, LL. LEER IG 人 的 偏 导 数 。 这 样 ，(4-2) 可 以 近似 为 ; 


c(x, y; Ax, Ay) = » uu. v) — I(u + Ax,v + Ay)? 


~ (Luv) T NI (4-4) 
Ax 
-[Ax IMG) A | 
34 


; 
n 


M(x,y)= > 


Ww 


I, (u,v) I (u, vM, (u, v) 
I (u,v) (u,v) L, (u,v)? 


> I (u,v) > I (u,v), (u,v) 
" > L (u,v)I, (u,v) > Lu,v) 
B A C 
IC B 


也 就 是 说 图 像 T(x,y) 在 点 (x,y) 处 平移 (Ax,Ay) Ja E] BHK RA TAA ARI RA: 


(4-5) 








Ax 
c(x, y; Ax, Ay) x [Ax Ay]M zl "i (4-6) 


二 次 项 函数 本 质 上 是 一 个 椭圆 函数 ， 二 次 项 特征 值 与 椭圆 变化 的 关系 如 图 4-11 Brun. 
椭圆 的 局 率 和 尺寸 是 由 M(x,y) 的 特征 值 4 、 元 决定 的 ， 椭 圆 的 方 回 是 由 M(x,y) 的 特征 矢 
量 决 定 的 ， 椭 圆 的 方程 式 为 : 

AX 
[Ax IMG.) E (4-7) 
Ay 

ÁO |R ZAR RE RET ES ER P IRI n. ER (边缘 ) 和 平面 之 间 的 关系 如 图 4-12 所 

示 。 可 分 为 三 种 情况 : 
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e HK 
41 和 42 都 很 大 ，E 在 所 有 


方向 都 是 增加 的 > 


变化 最 慢 
的 方向 
平面 
c \ 丸和 入 都 小 
As 


图 4-11 DRRR IES AG LAE HIT] X ZR E] 4-12 特征 值 与 图 像 中 点 线 面 乙 间 的 关系 


> 图 像 中 的 直线 。 一 个 特征 值 大 ， 为 一 个 特征 值 小 ， 即 0 AS ERA 邦 。 目 相关 函数 
值 在 菏 一 方 同 上 大 ， 在 其 他 方向 上 小 。 
> 图 像 中 的 平 血 。 两 个 特征 值 都 小 ， 且 近似 相等 ， 目 相关 冰 数 值 在 各 个 方向 上 者 小 。 
> 图 像 中 的 角 点 。 两 个 特征 值 虱 大 ， 且 近似 相等 ， 目 相关 函数 在 所 有 方 回 上 都 增 大 。 
根据 二 次 项 函数 特征 值 的 计算 方法 ， 可 以 求 式 (4-5) 的 特征 值 。 但 是 Harris 给 出 的 角 
点 判别 方法 并 不 需要 计算 具体 的 特征 值 ， 而 是 计算 一 个 角 氮 啊 应 值 丸 来 判断 角 点 。 尽 的 计算 
























































R = det M - a (traceMy (4-8) 
A B ner 
XP, det M 为 和 矩阵 MG A HJfrZjxX: traceM NERE M IER; a 为 经 验 
单数 ， 取 值 范围 0.04 一 0.06。 实 事 上 ， 特 征 值 是 隐 合 在 det 和 traceM H, WX: 
det M = 44 - AC- B^ 
traceM =4 +4 — A* C 


(4-9) 


"NN Harris 角 点 的 实现 步骤 





根据 上 述 讨 论 ， 可 以 将 图 像 Harris 角 点 的 检测 算法 实现 步骤 归纳 如 下 。 
D 计算 图 像 7(x,y) 在 x 和 yy AAT HARREI 、 了 了 。 





1-8 -re(10n, I -==18C101 
” Ox ” Oy 


2) 计算 图 像 两 个 方 同 杨 度 的 乘积 。 
Leld L Ll, deb 


3) 使 用 高 斯 函数 对 六 、 了 ”和 了 工 , 进行 高 斯 加 权 ， 生 成 矩阵 M 的 元 素 4、B、C。 





A-güj)-I/Gw B=g(1,)=1, Bw C=g(1,)=T,®w 
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4) 计算 每 个 像 元 的 Harris WIER, FITERE RENE., 
R - IR:det M — a(traceMy <t} 
5) 在 3x3 或 5x5 IA IIT T HEC EU I, FARE ELI A EUER BJ Re 


"MEM Harris 角 点 的 性 质 


(1) 参数 w 对 角 点 检测 的 影响 
假设 已 经 得 到 了 式 〈4-$) Bros BE M WEE A, 24,20, SAS, A-kA, 
0 入 有 入 1 。 由 特征 值 与 矩阵 M 的 直 迹 和 行列 式 的 关系 可 得 : 





det M =| | 4 
(4-10) 
traceM = > A 
由 (4-10) 式 可 得 
R-AA, —a(A - AY. 2 A (k-a(1- ky) (4-11) 
假设 R>0， 则 有 
<— «035 
(1+k) 


对 于 较 小 的 k 值 ，R SA*(k-Q),a<k。 

由 些 ， 可 以 得 出 这 样 的 结论 : 增 大 值 ， 将 减 小 角 点 啊 应 伸 R， 降 低 角 点 检测 的 灵敏 
性 ， 减 少 被 检测 角 点 的 数量 ; 减 小 但， 将 增 大 角 点 啊 应 值 尺 ， 增 加 用 点 检测 的 灵敏 性 ， 增 
加 被 检测 角 点 的 数量 。 

(2) Harris 角 点 检测 算 子 对 之 度 和 对 比 度 的 变化 不 敏感 

Harris. 角 点 检测 算 子 对 图 像 腕 度 和 对 比 度 的 变化 不 敏感 ， 如 图 4-13 所 示 。 这 是 因为 在 
进行 Harris 角 点 检测 时 ， 使 用 了 微分 算 子 对 图 像 进 行 微 分 运算 ， 而 微分 运算 对 图 像 密度 的 拉 
升 或 收 绑 和 对 腕 度 的 抬 高 或 下 降 不 敏感 。 换 言 之 ， 对 亮度 和 对 比 上 度 的 仿 射 变换 并 不 改变 
Harris 啊 应 的 极 值 点 出 现 的 位 置 。 但 是 ， 由 于 羡 值 的 选择 ， 可 能 会 影响 检测 角 点 的 数量 。 


图 4-13 有 融 度 和 对 比 度 的 变化 对 Harris 检测 算 子 的 影响 















































a) 亮度 : 三 Itb 的 变化 不 影响 响应 值 R 的 峰值 位 置 和 个 数 b) 对 比 度 : al 的 变化 不 影响 R 的 位 置 和 个 数 


(3) Harris 角 点 检测 算 子 具有 旋转 不 变性 
Harris 角 点 检测 算 子 使 用 的 是 角 点 附近 区 域 灰 度 二 阶 窍 阵 。 而 二 阶 窃 阵 可 以 表示 成 一 个 
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椭圆 ， 椭 圆 的 长 短 轴 正 是 二 阶 年 阵 特征 值 平方 根 的 倒数 值 。 如 图 4-14 所 示 ， 当 特征 椭圆 转 
动 时 ， 特 征 值 并 不 发 生变 化 ， 判 断 角 点 的 响应 值 也 不 发 生变 化 。 所 以 ，Harris 角 点 检测 算 
子 具有 旋转 不 变性 。 
(4) Harris 角 点 检测 算 子 不 具有 尺度 不 变性 > 
如 图 4-15 所 示 ， 当 右 图 被 缩小 时 ， 在 检测 窗口 尺寸 不 变 的 前 提 下 ， 在 窗口 内 的 所 包含 
图 像 的 内 容 是 完全 不 同 的 。 左 侧 的 图 像 可 能 被 检测 为 边缘 或 曲线 ， 而 右 侧 的 图 像 则 可 能 被 检 
测 为 一 个 角 点 。 


N, 
cx 


图 4-14 角 点 与 特征 椭圆 图 4-15 尺度 变化 对 Harris 角 点 检测 算 子 的 影响 


4.3.5 人 殉 程 精 讲 


例 程 4-6 是 对 图 像 进 行 Harris 角 点 检测 的 MATLAB 实现 代码 。 
例 程 4-6 
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function [posr, posc]-Harrisl(in image,a) 
% 功能 : 检测 图 像 的 Harris HA 
% 输入 : in_image 一 竺 检测 的 RGB 图 像 数 组 














% a 一 角 点 参数 啊 应 ， 取 值 范围 为 : 0.04 一 0.06 
% 输出 : posr 一 所 检测 出 角 点 的 行 坐标 问 量 
% posc 一 所 检测 出 角 点 的 列 坐 标 回 量 


% 将 RGB 图 像 转 化 成 灰 度 图 像 
in image-rgb2gray(in 1mage); 

% unit8 型 转化 为 双 精 度 double64 型 
or im-double(in image); 


%%%%%% 计 算 图 像 在 x、y AAD m IRI 8 9/09/09/09/09/09/6 
%X 方 向 梯度 算 子 模板 

fx = [-10 1]; 

% x Jj PJEV 

Ix — filter2(fx,ori im); 

Voy 方 同 梯 度 算 子 

fy = [-1;0;1]; 

Vo y Ji EY 

Iy = filter2(fy,ori im); 











%%%%%% 计 算 两 个 方 同 的 梯度 乘积 %%%%%% 


Ix2 = Ix.^2; 
Iy2 — Iy.^2; 
Ixy = Ix.*Iy; 








%9%9%%%9% 使 用 高 斯 函数 对 梯度 乘积 进行 加 权 %%%%%6%6 
% 产生 7*7 的 高 斯 窗 函 数 ，sigma=2 

h= fspecial('gaussian',[7 7],2); 

Ix2 = filter2(h,Ix2); 

Iy2 — filter2(h,Iy2); 

Ixy — filter2(h,Ixy); 


%%%%%% 计 算 每 个 像 元 的 Harris 响应 值 %%%%%% 
[height,width|-size(ori im); 
R = zeros(height,width); 
% 像素 (ijj) 处 的 Harris 啊 应 值 
for i = 1:height 
for j = 1:width 
M = [Ix20,4)) Exy(1);Ixy(1,) Iy2(,)]; 
R(1,]) = det(M)-a*(trace(M))^2; 
end 


end 





969/99/99/99/69/0 2 fi^] v-]- REA Harris 啊 应 值 %%%%%% 
Rmax-max(max(R)); 


% BI 
t-0.01* Rmax; 


for1= l:height 

forj = 1:width 

if R(1,])«t 
R(1,) = 0; 
end 

end 


end 


%%%%%% 进 行 3x3 领域 非 极 大 值 抑制 %%%%%% 
% 进行 非 极 大 抑制 ， 窗 口 大 小 3*3 
corner peaks-imregionalmax(R); 


countnum-sum(sum(corner peaks)); 


%%%%%% 显 示 所 提取 的 Harris Hi 1390906909690 
% posr 是 用 于 存放 行 坐标 的 问 量 

[posr, posc] = find(corner peaks== 1); 

% posc 是 用 于 存放 列 坐标 的 问 量 


figure 











图 像 特征 提取 





imshow(in image) 

hold on 

for1— 1 : length(posr) 

plot(posc(1),posr(1),'r--); > 


end 
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图 4-16a 是 例 程 4-6 的 运行 过 程 ， 图 4-16b 是 采用 上 述 MATLAB 程序 对 一 幅 输 入 图 像 
进行 Harris 角 点 检测 的 结果 。 





>> I-imread( hua6. jpg): 


>> [posr, poscl-Harrisl(I, 0.05); ; 
Warning: Image is too big to fit on screen; displaying at 6T% 十 <560x420x3 uint? «Too... XToo... 


> In imuitoolsYprivateXinitSize at T3 HH pose XT8x1 double? 2 419 
In imshow at 263 Hd posr 《1T8xl double? 2 560 





In Harrisl at 68 








b) 
K| 4-16 例 程 4-6 对 输入 图 像 进行 Harris 角 点 检测 的 结果 
a) 运行 过 程 b) 检测 结果 


在 MATLAB 7.10.0 版 本 中 ， 可 以 调用 C = cornermetric (IL,'Harris'〉 来 检测 图 像 的 Harris 
角 点 特征 。 其 中 ，7 为 输入 的 灰 度 图 像 矩 阵 ; C 为 角 点 量度 和 矩阵， 用 来 探测 图 像 了 中 的 角 点 
信息 ， 并 与 了 同 尺 寸 ，C 的 值 越 大 表示 图 像 I 中 的 像素 越 有 可 能 是 一 个 角 点 。 
例 程 4-7 是 通过 调用 cornermetric 函数 对 图 像 进 行 Harris 角 点 检测 的 MATLAB 实现 
代码 。 
例 程 4-7 
%%%%%% 读 入 图 像 并 显示 %%%%%% 
I-imread('hua.]pg); 
% 将 RGB 图 像 转 换 成 灰 度 图 像 
I=rgb2gray(]); 
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subplot(1,3,1); 
imshow!(]); 


title(' 输 入 图 像 '); 


%%%%%% 生 成 角 扣 度量 矩阵 并 进行 调整 %%%%%% 
% 生 成 角 点 度量 窍 阵 

C = cornermetric(I,'Harris"); 

C adjusted = imadjust(C); 

subplot(1,3,2); 

imshow(C adjusted); 

title fi AEREN; 








%%%%%% 寻 找 并 显示 Harris ff 1%%%%%% 
corner peaks = imregionalmax(C); 
corner idx = find(corner peaks == true); 
[r g b] = deal(I); 

r(corner idx) = 255; 

g(corner idx) = 255; 

b(corner ldx) = 0; 

RGB - cat(3,r,g,b); 

subplot(1,3,3); 

imshow(RGB); 

title( 检 测 出 的 Harris £f A; 
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图 4-17 是 采用 上 述 MATLAB 程序 对 一 幅 输 入 图 像 进行 Harris 角 点 检测 的 结果 。 


葵 入 图 像 角 后 矩阵 





图 4-17 例 程 4-7 对 输入 图 像 进 行 Harris 角 点 检测 的 结果 


4.4 SIFT 特征 提取 与 描述 


人 类 在 识别 一 个 物体 时 ， 不 管 这 个 物体 是 远 还 是 近 ， 痢 能 对 它 进行 正确 的 辨识 ， 这 整 是 
所 谓 的 “尺度 不 变性 ”。 同 样 ， 当 这 个 物体 发 生 旋转 时 ， 人 类 照样 可 以 正确 地 识别 它 ， 这 吏 
是 所 谓 的 “旋转 不 变性 ”……… 那么 ， 如 何 让 机 器 与 人 类 一 样 上 共有 这 种 能 力 呢 ? 这 束 是 图 像 局 
部 不 变 特 性 要 解决 的 问题 。 对 于 图 像 不 变性 特征 提取 的 方法 ， 核 心 是 “不 变性 ”三 个 字 。 

提 到 图 像 局 部 不 变性 特征 ， 有 两 个 人 不 得 不 提 及 ， 一 个 是 Lindeberg， 另 一 个 是 Lowe. 
如 果 将 局 部 不 变性 特征 方法 比 作 一 个 孩子 ， 那 么 ，Lindeberg 就 是 这 个 孩子 的 父亲 ，Lowe 是 
母 杀 。Lindeberg 芮 定 了 局 部 不 变 特 征 方法 的 理论 基础 ， 播 下 了 局 部 不 变性 特征 方法 的 种 
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子 ， 而 Lowe 则 将 这 颗 种 子 孕育 成 一 种 能 具体 实现 的 方法 。 由 于 在 Lindeberg 的 尺度 空间 理 
论 中 ， 各 种 高 斯 微分 算 子 与 哺乳 动物 的 视网膜 和 视觉 皮层 的 感受 域 剖 面 有 着 高 度 的 相似 性 ， 
所 以 ， 尺 度 空间 理论 经 常 与 生物 视觉 相关 联 ， 有 人 也 称 图 像 局 部 不 变性 特征 方法 为 基于 生物 
视觉 的 不 变性 方法 。 > 


ANE SIFT 算法 


Lowe 总 结 了 现 有 的 特征 提取 方法 ， 并 提出 了 一 种 新 型 高 效 的 特征 检测 描述 方法 一 一 
SIFT (Scale Invariant Feature Transform). SIFT 的 主要 思路 是 : 首先 建立 图 像 的 尺度 空间 表 
不 ， 然 后 在 尺度 空间 中 搜索 图 像 的 极 值 点 ， 由 极 值 点 再 建立 特征 摘 述 问 量 ， 最 后 用 特征 描述 
问 量 进行 相似 度 匹 配 。 采 用 SFT 方法 提取 的 图 像 特征 具有 放 缩 不 变性 、 旋 转 不 变性 ， 仿 射 
不 变性 ， 还 有 一 定 的 抗 光 照 变 化 和 抗 视 点 变换 性 能 。 该 特征 还 具有 高 度 的 可 区 分 性 ， 能 够 在 
一 个 上 只 有 大 量 特征 数据 的 数据 库 中 进行 精确 地 匹配 。SIFT 还 使 用 金字 塔 算法 大 大 缩小 了 提 
取 特 征 时 的 运算 量 。 计 算 方法 分 为 四 个 步骤 : 尺度 空间 极 值 提 取 、 特 征 点 定位 、 特 征 方 癌 赋 
值 和 提取 特征 点 描述 。 

(1) 尺度 空间 极 值 检测 

尺度 空间 理论 是 检测 不 变 特征 的 基础 。Witkin (1983) 提出 了 尺度 空间 理论 ， 他 主要 讨 
论 了 一 维 信号 平滑 处 理 的 问题 。Koenderink (1984) 把 这 种 理论 扩展 到 二 维 图 像 ， 并 证 明 高 
斯 卷 积 核 是 实现 尺度 变换 的 唯一 变换 核 。 

一 幅 二 维 图 像 在 不 同 尺 度 下 的 尺度 空间 表示 可 由 网 像 与 高 斯 核 卷 积 得 到 : 

L(x,y,0) 2 G(x, y,o)* I(x, y) (4-12) 

其 中 ， G(x,y,0) 为 局 斯 核 函 数 。 
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e 2€ (4-13) 
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AB. Qe y) 为 图 像 点 的 像素 坐标 ，7T(x,y) 为 图 像 数 据 。o RARETAT, IER 
斯 正 态 分 布 的 方 奎 ， 反 上 映 了 图 像 被 平滑 的 程度 ， 其 值 越 小 表征 网 像 被 平滑 程度 越 小 ， 相 应 尺 
EERD. Lx, yo) 代表 了 图 像 的 尺度 空间 。 

为 高 效 地 在 尺度 空间 内 检测 出 稳定 的 特征 点 ，Lowe 使 用 尺度 空间 中 差分 局 区 
(Difference of Gaussian, DOG) 极 值 作为 判断 依据 。DOG 算 子 定义 为 两 个 不 同 尺度 的 高 斯 
核 的 靶 分 ， 是 归 一 化 LoG (Laplacian-of-Gaussian, LOG) 算 子 的 近似 。 设 为 两 个 相 邻 尺度 
则 的 比例 因子 ， 则 DoG 算 子 定义 如 下 。 

D(x, y,o) 2 (G(x, y, ko) - G(x,y,0))™ T(x,y) 
= L(x, y,ko) - L(x, y,o) 

D(x,y,o) 构造 方式 如 图 4-18， 其 建立 高 斯 图 像 〈 图 中 左 列 ) 5 DoG (图 中 右 列 两 个 
金字 塔 。 高 斯 网 像 金字 塔 分 为 多 组 ， 每 组 间 又 分 为 多 层 。 一 组 中 的 多 层 间 不 同 的 是 尺度 ， 相 邻 
层 间 尺度 相差 一 个 比例 因子 上 。 在 S 个 尺度 间隔 内 变化 尺度 因子 ， 如 使 加 倍 ， 则 k EN 
为 了 在 整个 金字 塔 内 获取 DoG 极 值 ， 应 在 高 斯 金字 塔 中 生成 S+3 层 遍 斯 平滑 图 像 。 下 一 组 
图 像 的 最 确 层 由 上 一 组 中 尺度 为 2o 的 图 像 进行 因子 为 2 的 降 采 样 得 到 ， 其 中 c 为 上 一 组 中 最 





G(x,y,0)-7 

















(4-14) 
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底层 图 像 的 尺度 因子 。DOG 金字 塔 由 相 邻 的 高 斯 图 像 金字 塔 相 减 得 到 ， 如 图 4-19 所 示 。 
RE 3 | 


下 一 组 


尺度 
下 一 组 





差分 高 斯 金字 塔 


高 斯 金字 塔 pe 


图 4-18 高 斯 图 像 金字 塔 (5=2) 与 DOG 人 金字塔 — 图 4-19 所 生成 的 高 斯 图 像 金 字 塔 与 DOG 金字塔 


金子 塔 中 每 个 融 斯 图 像 的 o 为 : 





O+S 


olo,s)=0,2 5. (4-15) 

其 中 ，o 为 基础 尺度 因子 ; o,s 分 别 为 图 像 所 在 的 图 像 组 坐标 、 组 内 层 坐 标 ， 
o €o *[0,.,0-1], se[0..,S-1]: on 是 第 一 个 金字 塔 组 的 坐标 ， 通 常 o， 取 0 或 者 -1， 
当 设 为 -1 的 时 候 ， 则 图 像 在 计算 高 斯 尺度 空间 前 先 扩 大 一 倍 。 在 Lowe 的 算法 实现 中 ， 以 上 
参数 的 取 值 如 下 ，w =1.6.27.o =_1S=3，。 

JE). "EDBIAABS x 是 组 坐标 o 的 函数 。 设 坟 为 第 0 组 内 的 空间 坐标 ， 则 有 x=2°x， 
xy €[0,..., No - 1]x[0,...,M, ^1], HP (NM) 是 第 0 组 中 图 像 的 分 辨 率 。 设 (N6,M0) 为 第 0 
组 中 的 图 像 分 辨 率 ， 则 其 他 组 的 分 辨 率 为 : 

=| Ze] M, 2L (4-16) 
2 X 

金字 塔 构造 完 后 开始 检测 DoG 局 部 极 值 。 其 中 每 个 像素 需要 跟 同 一 尺度 的 周围 邻 域 8 
个 像素 和 相 邻 尺度 对 应 位 置 的 周围 邻 域 9x2 个 像素 总 共 26 个 像素 进行 比较 ， 如 图 4-20 所 
示 。 仅 当 被 检测 点 的 DOG 值 大 于 此 26 个 像素 点 或 小 于 此 26 个 像素 点 时 才 将 该 点 判定 为 极 
值 点 并 保存 以 进行 后 续 计 算 。 

(2) 确定 关键 点 位 置 及 尺度 

通过 拟 和 三 维 二 次 函数 以 精确 确定 关键 点 的 位 置 和 尺度 ， 得 到 原 图 像 SIFT 候选 特征 点 
集合 ， 如 图 4-21 所 示 。 

在 得 到 原 图 像 的 SIFT 候选 特征 点 集合 X 后 ， 要 从 中 筛选 稳定 的 点 作为 该 图 像 的 SIFT 
特征 点 ， 其 组 成 的 集合 用 怀表 示 。 由 于 马 中 对 比 度 较 低 的 点 对 噪音 较 敏 感 ， 而 位 于 边缘 上 
的 点 难以 准确 定位 ， 为 确保 SIFT 特征 点 的 稳定 性 ， 必 须 将 这 两 种 点 剔除 。 

1) 剔除 对 比 度 低 的 点 

将 候选 特征 点 x 的 偏 移 量 定义 为 Ar ， 其 对 比 度 为 D(x) 的 绝对 值 |D(x) 
数 表 达 式 〈4-14) 进行 泰勒 级 数 展开 
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- 1 : 
DG) - De 2 Ne t $5 (4-17) 
2 n-1 
式 中 ， 由 于 x 为 DOG 函数 的 极 值 点 ， 所 以 二 ee -0 ， 解 方程 得 Ar= OP D, 
X 





通过 多 次 迭代 得 到 最 终 候 选 点 的 精确 位 置 及 尺度 鞠 ， 将 其 代入 公式 求 得 D(?)， 求 其 绝对 值 

可 得 |D(%) o BR HERREN T. ， 则 低 对 比 度 点 的 剔除 公式 为 
xeX [D($)2 T., x e X, 
ex ID($)|« T,, x e X, 





(4-18) 








高 斯 差 图 像 (D) | 
图 4-20 DOG 空间 局 部 极 值 检测 K| 4-21 原 图 像 的 SIFT 候选 特征 点 集合 
2) Al RR Fi 
由 于 边缘 梯度 方向 上 主 曲率 值 较 大 ， 而 边缘 方 问 上 曲率 较 小 ， 在 边缘 上 得 到 的 DOG K 
数 的 极 值 点 与 非 边 缘 区 域 的 点 相 比 ， 其 主 则 率 比 值 较 大 ， 因 此 可 以 将 主 曲率 比值 大 于 一 定 阔 
值 的 点 视 为 位 于 边缘 上 的 点 将 其 剔除 。 
由 于 候选 点 的 DOG 函数 D(x) 的 主 曲 率 与 2X2 的 Hessian 4E [VE H 的 特征 值 成 正比 。 
四 x 
H = (4-19) 
D Dy 
KFP, Dao Dy, Dy 为 候选 点 邻 域 对 应 位 置 的 像素 差分 。 令 2 NH 的 最 大 特征 值 ， [为 


H 的 最 小 特征 值 ， 令 7 Ug 则 D(x) 的 主 曲 紊 比值 与 7 成 正比 。 由 石 的 迹 和 行列 式 的 值 可 得 




















Tr(H)- D. +D,,=a+p (4-20) 

Det(H) - D.D,, -(D,) - aff (4-21) 
TH) (a-By QGB*-py (y*W F 

Det(H) of | yp? y SA 





CED jUgiiiitrl Hire, GHEGLI ACIES MRES H 
随 着 y 的 增 大 而 增 大 。 设 主 曲 率 比 什 闵 值 为 7 RUD P RU I CR: 


2 (T+1) 
Tr(H) = ) | xe X, 
udi. (4-23) 
Tr(Hy (T, +D 
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剔除 低 对 比 度 和 边缘 点 所 剩 的 特征 点 如 
图 4-22 所 示 。 

3) KEAN In] ff AE 

通过 确定 关键 点 的 方 回 ， 可 以 使 特征 描 
述 符 以 与 方向 相关 的 方式 构造 ， 从 而 使 算 子 
其 有 旋转 不 变性 。 关 键 点 的 方 回 利 用 其 邻 域 

H e Re ZA ea Or ARAN 
LL re P J pim E 4-22 剔除 低 对 比 度 和 边缘 点 后 所 剩 的 特征 点 
J 0(x,y) 可 以 通过 如 下 公式 计算 得 到 。 

mx, y) - VLGx+1,y) - Lx -1,y)Ý +[L(x, y +D- L(x, y- DÝ 

a L(x, y - 1) - L(x, y - 1) (4-24) 
L(x -ly)-L(x-ly) 
其 中 Z(xz, 妇 所 用 尺度 为 天 键 点 所 在 矿 度 。 


AE SIFT 特征 描述 


对 每 个 关键 点 ， 在 以 其 为 中 心 的 邻 域 窗口 内 利用 直方 图 的 方式 统计 邻 域 像素 的 梯度 分 
布 。 此 直方 图 有 36 个 柱 ， 每 柱 10” ， 共 360”。 每 个 加 入 直方 图 的 邻 域 像素 样本 的 权重 由 该 
像素 的 梯度 模 与 高 斯 权重 确定 ， 此 高 斯 窗 的 o 为 关键 点 的 尺度 的 1.5 倍 ， 加 入 高 斯 窗 的 目的 
是 增强 离 关 键 点 近 的 邻 域 点 对 关键 点 的 影响 。 

直方 图 的 峰值 反映 了 关键 点 所 处 邻 域 梯度 的 主 方向 。 完 成 直方 图 统计 后 ， 找 到 直方 图 的 
最 高 峰值 以 确定 关键 点 的 方向 。 关 键 点 的 方向 可 以 由 离 最 高 峰值 最 近 的 三 个 柱 值 通过 抛物 线 
插值 精确 得 到 。 

在 梯度 方向 直方 图 中 ， 当 存在 一 个 大 于 等 于 主峰 值 80% 能 量 的 峰值 时 ， 则 添加 一 个 新 关 
键 点 ， 此 关键 点 的 坐标 、 尺 度 与 当前 关键 点 相同 ， 但 方向 为 由 此 峰值 确定 的 方向 。 因 此 一 个 关 
键 点 可 能 产生 多 个 坐标 、 尺 度 相 同 ， 方 癌 不 同 的 关键 点 。 这 样 做 的 目的 是 增强 匹配 的 鲁 棒 性 。 

至 此 ， 特 征 点 检测 完毕 ， 特 征 描述 前 的 准备 工作 已 经 完成 。 每 个 关键 点 含有 三 个 信息 : 
坐标 、 尺 度 、 方 同 。 下 一 步 则 为 特征 问 量 生 成 。 

首先 将 坐标 轴 旋 转 为 关键 点 的 方向 ， 以 确保 旋转 不 变性 。 

接 下 来 以 关键 点 为 中 心 取 8x8 的 窗口 。 图 4-23a 的 中 央 白 点 为 当前 关键 点 的 位 置 ， 每 个 
小 格 代 表 关 键 点 邻 域 所 在 尺度 空间 的 一 个 像素 ， 箭 头 方 同 代表 该 像素 的 梯度 方向 ， 箭 头 长 度 
代表 梯度 模 值 ， 图 中 的 圈 代 表 高 斯 加 权 的 范围 《〈 越 靠近 关键 点 的 像素 梯度 方向 信息 贡献 越 
大 )。 然 后 在 每 4x4 的 小 块 上 计算 8 个 方 癌 的 梯度 方向 直方 网， 绘制 每 个 梯度 方 癌 的 累加 
值 ， 即 可 形成 一 个 种 子 点 ， 如 图 4-23b 所 示 。 此 图 中 一 个 关键 点 由 2x2 共 4 个 种 子 点 组 成 ， 
每 个 种 子 点 有 8 个 方 癌 回 量 信息 。 这 种 邻 域 方向 性 信息 联合 的 思想 增强 了 算法 抗 噪声 的 能 
力 ， 同 时 对 于 含有 定位 误 兰 的 特征 匹配 也 提供 了 较 好 的 容错 性 。 

实际 计算 过 程 中 ， 为 了 增强 匹配 的 稳健 性 ，Lowe 建议 对 每 个 关键 点 使 用 4x4 共 16 个 种 
子 点 来 描述 ， 这 样 对 于 一 个 关键 点 就 可 以 产生 128 个 数据 ， 即 最 终 形成 128 维 的 SIFT 特征 
器 量 。 此 时 SFT 特征 向 量 已 经 去 除了 尺度 变化 、 旋 转 等 几何 变形 因素 的 影响 ， 再 继续 将 特 
征 问 量 的 长 度 归 一 化 ， 则 可 以 进一步 去 除 光 照 变化 的 影响 。 
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a) b) 
图 4-23 特征 点 的 特征 问 量 构 造 


ERIR, ERR SIFT 特征 点 及 其 特征 问 量 的 流程 如 图 4-24 所 示 。 









需要 预先 
高 斯 卷 积 吗 ? 





建立 高 斯 卷 积 图 L 建立 高 斯 差 图像 DOG 查找 邻 域 极 值 


提取 下 一 个 候选 特征 点 
| 4 


不 良 边 缘 ? 








是 否 处 于 低 
对 比 度 位 置 ? 













是 否 所 有 候选 
特征 点 都 已 处 理 ? 









图 4-24 提取 SIFT 特征 点 及 其 特征 向 量 的 流程 
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4.4.3 人 列 程 精 讲 


例 程 4-8 是 SIFT 算法 实现 的 MATLAB 源 程 序 ， 读 者 可 以 根据 程序 及 相关 的 注释 对 
SIFT 作 进 一 步 的 理解 。 
例 程 4-8 





DLELLLLLLELLLLLLLLLLLLLELLELLLLLLLLLLLLLLLELLELLLLLLLLLLLLLLLLLLLLLLLLLEE 


function [ pos, scale, orient, desc | = SIFT( im, octaves, intervals, object mask, contrast threshold, 


curvature threshold, interactive ) 





% 功能 : 提取 灰 度 图 像 的 尺度 不 变 特 征 CSIFT 特征 ) 

% 输入 : 

% im - 灰 度 图 像 ， 该 图 像 的 灰 度 值 在 0 到 1 之 间 

% octaves - 金字 塔 的 组 数 : octaves AWEN 4) 

% intervals - 该 输 入 参数 决定 每 组 金字 塔 的 层 数 (默认 值 为 2) 

% object mask - 确定 网 像 中 尺度 不 变 特征 点 的 搜索 区 域 

% contrast threshold - XJ HEE pa E XA fH. 7 0.03). 

% curvature threshold - WE GREN 10.00 . 

% interactive - 函数 运行 显示 标志 ， 将 其 设 定 为 1, 则 显示 算法 运行 时 间 和 过 程 的 相关 信息 ; 
% 如 果 将 其 设 定 为 2， 则 仅 显 示 最 终 运行 记过 (default = 1). 

vo 输出 : 

% pos - Nx2 和 矩阵， 每 一 行 包括 尺度 不 变 特征 点 的 坐标 (x,y) 

% scale - Nx3 和 窍 阵 ， 每 一 行 包括 尺 度 不 变 特 征 点 的 尺度 信息 

% orient - Nx1 癌 量 ， 每 个 元 素 是 特征 点 的 主 方 回 ， 其 郊 围 在 [-pipi)z lH). 
% desc - Nx128 矩阵 ， 每 一 行 包含 特征 点 的 特征 癌 量 . 

% 参考 文献 : 


% [1] David G. Lowe, "Distinctive Image Features from Sacle-Invariant Keypoints", 















































% accepted for publicatoin in the International Journal of Computer 
% Vision, 2004. 
% [2] David G. Lowe, "Object Recognition from Local Scale-Invariant Features", 
% Proc. of the International Conference on Computer Vision, Corfu, 
% September 1999. 
% 设 定 输 入 量 的 默认 值 
if ~exist('octaves') 
octaves = 4; 
end 
if ~exist('intervals') 
intervals = 2; 
end 
if -exist('object mask") 
object mask = ones(size(1m)); 
end 


if size(object mask) ~= size(im) 
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object mask = ones(size(1m)); 
end 
if ^exist('contrast threshold") 
contrast threshold = 0.02; 
end 
if ^exist(' curvature threshold") 
curvature threshold = 10.0; 





end 
if -exist('interactive") 
interactive = 1; 


end 





% MEWAK RBK P 8 ACE En C.H — 1530 [0,1] 
if( (min(1m(:)) < 0) | (max(im(:)) > 1) ) 
fprintf( 2, "Warning: image not normalized to [0,1 ].n' ); 


end 


% 将 输入 图 像 经 过 高 斯 平滑 处 理 ， 采 用 双 线 性 差 值 将 其 扩大 一 倍 
if interactive >= 1 

fprintf( 2, 'Doubling image size for first octave...\n' ); 
end 
tic; 
antialias sigma — 0.5; 
if antialias sigma == 

signal — im; 
else 

g = gaussian filter( antialias sigma ); 

if exist('corrsep') == 3 

signal = corrsep( g, g, im ); 
else 
signal = conv2( g, g, im, 'same' ); 

end 
end 
signal — im; 
[X Y] = meshgrid( 1:0.5:size(signal,2), 1:0.5:size(signal,1) ); 
signal = interp2( signal, X, Y, '*linear' ); 
subsample = [0.5 |; 


%%%%%% 下 一 步 是 生成 高 斯 和 差分 高 斯 (DOG) 金 字 塔 %%%%%% 
%%%%%% 高 斯 金字 塔 含有 s+3 层 ， 差 分 高 斯 金字 塔 含有 s+2 层 %%%%%% 


if interactive >= 1 











fprintf( 2, 'Prebluring image...n' ); 











MATLAB 54:3: 


end 
preblur sigma = sqrt(sqrt(2)^2 - (2*antialias sigma)^2); 
if preblur sigma == 
gauss _pyr{1,1} = signal; 
else 
g = gaussian filter( preblur sigma ); 
if exist('corrsep') == 
gauss _ pyr{1,1} = corrsep( g, g, signal ); 
else 
gauss pyr(1,1] = conv2( g, g, signal, 'same' ); 
end 
end 
clear signal 
pre time = toc; 
if interactive >= 1 
fprintf( 2, 'Preprocessing time %.2f seconds. n', pre time ); 


end 





Vo 第 一 组 第 一 层 的 sigma 
initial sigma — sqrt( (2*antialias sigma)^2 + preblur sigma^2 ); 


% 记录 每 一 层 和 每 一 个 尺度 的 sigma 
absolute sigma = zeros(octaves,intervals--3); 


absolute sigma(1,1) = initial sigma * subsample(1); 


% 记录 产生 金字 塔 的 滤波 器 的 太 寸 和 标准 差 
filter size = zeros(octaves,intervals--3); 


filter sigma = zeros(octaves,intervals--3); 


% 生成 高 斯 和 拳 分 蜗 其 金字塔 


if interactive >= 1 





fprintf( 2, 'Expanding the Gaussian and DOG pyramids...\n' ); 
end 
tic; 
for octave = l:octaves 
if interactive >= 1 
fprintf( 2, "Processing octave 96d: image size %d x %d subsample %.1fin', 
size(gauss pyríoctave,1),2), size(gauss pyr(octave,17,1), subsample(octave) ); 
fprintf( 2, AtAtInterval 1 sigma vof n', absolute sigma(octave,1) ); 


octave, 








ctae EIS 





end 

sigma — initial sigma; 

g = gaussian filter( sigma ); 

filtrer size( octave, 1 ) = length(g); > 
filter sigma( octave, 1 ) = sigma; 

DOG pyr{octave} = zeros(size(gauss pyr{octave,!1},]),size(gauss pyríoctave,l ),2),intervals--2); 


for interval = 2:(intervals+3) 





% 计算 生成 下 一 层 几 何 采 样 金 字 塔 的 标准 差 
% HHF, sigma 计 ]1 = k*sigma. 
% sigma i+1^2 = sigma f,1^2 + sigma 1^2 


Vo (k*sigma 1)^2 = sigma _f,1^2 + sigma 1^2 





% 因此 : 

Y0 sigma fj = sqrt(k^2 - 1)sigma 1 

% 对 于 扩展 的 组 Cspan the octave) , k ^ 2^(l/intervals) 
% 所 以 


yo sigma f,i = sqrt(2^(2/intervals) - 1)sigma 1 


sigma f= sqrt(2^(2/intervals) - 1)*sigma; 
g = gaussian filter( sigma f); 


sigma = (2^(l/intervals))*sigma; 


% 记录 sigma 的 值 


absolute sigma(octave,interval) = sigma * subsample(octave); 





% WKAR STREE 
filter_size(octave,interval) = length(g); 


filter_sigma(octave,interval) = sigma; 


if exist('corrsep') == 3 

gauss pyr[octave,interval) = corrsep( g, g, gauss pyríoctave,interval-1] ); 
else 

gauss pyr[octave,interval) = conv2( g, g, gauss pyr1octave,nterval-1), 'same' ); 
end 


DOG pyr{octave}(:,: interval l-1) = gauss pyríoctave,interval) - gauss pyr(octave,interval-1); 


if interactive >= 1 
fprintf( 2, NtInterval %d sigma %f\n', interval, absolute sigma(octave,interval) ); 


end 








! 
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end 
if octave < octaves 


sz = size(gauss_pyr{octave,intervals+1 }); 
[X Y] = meshgrid( 1:2:sz(2), 1:2:sz(1) ); 
gauss pyr([octave*1,1] = interp2(gauss pyr1octave,intervals*1 ), X, Y,'*nearest'); 
absolute sigma(octave--1,1) = absolute sigma(octave,intervals-* 1); 
subsample = [subsample subsample(end)*2 |; 
end 
end 
pyr time = toc; 
if interactive >= 1 
fprintf( 2, 'Pryamid processing time %.2f seconds. n', pyr time ); 


end 





% 在 交互 模式 下 显示 高 斯 金字 塔 
1f interactive >= 2 





sz = zeros(1,2); 
sz(2) = (intervals+3)*size(gauss_pyr{1,1},2); 
for octave = 1:octaves 
sz(1)= sz(1) + size(gauss_pyr{octave,1},1); 
end 
pic = zeros(sz); 
y=l; 
for octave = 1:octaves 
x= l; 
sz-—size(gauss pyr1octave,1]); 
for interval = l:(intervals + 3) 
pie(y:(y-sz(1)-1),x:(x-^sz(2)-1)) = gauss pyríoctave,interval) ; 
x =x + sz(2) 
end 
y =y + sz(1); 
end 
fig = figure; 
clf; 
imshow(pic); 
resizeImageFig( fig, size(pic), 0.25 ); 
fprintf( 2, 'The gaussian pyramid (0.25 scale). AnPress any key to continue. n' ); 
pause; 
close(fig) 
end 











% 在 交互 模式 下 显示 差分 高 斯 金字 塔 
if interactive >= 2 
Sz — zeros(1,2); 
sz(2) = (intervals-2)*size(DOG pyr{1}(:,:,1),2); 
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for octave = 1:0ctaves 
sz(1) = sz(1) + size(DOG pyr(íoctavej(:,:,1),1); 
end 
pic = zeros(sz); 
y= 1; 
for octave = 1:0ctaves 





X= 1]; 
sz = slze(DOG pyr{octave}(:,:,1)); 
for interval = 1:(intervals + 2) 
pic(y:(y+sz(1)-1),x:(x+sz(2)-1)) = DOG pyr{octave}(:,:,interval); 
x =x + sz(2); 
end 
y =y + sz(1); 
end 
fig = figure; 
clf; 
imagesc(pic); 
resizeImageFig( fig, size(pic), 0.25 ); 
fprintf( 2, "The DOG pyramid (0.25 scale).AnPress any key to continue. n' ); 
pause; 
close(fig) 
end 





% 下 一 步 是 查找 兰 分 高 斯 金字 塔 中 的 局 部 极 值 ， 并 通过 曲率 和 照度 进行 检验 


curvature threshold = ((curvature threshold + 1)^2)/curvature threshold; 





% 二 阶 微 分 核 

xx-[1-2 I] 

yy = xx'; 
xy-[10-1;000;-101]/4; 


raw keypoints = []; 
contrast keypoints = []; 
curve keypoints = []; 





% (Er AP EB BHRTH 
if interactive >= 1 
fprintf( 2, 'Locating keypoints...n' ); 
end 
tic; 
loc = cell(size(DOG pyr)); 
for octave = l:octaves 
if interactive >= 1 
fprintf( 2, NProcessing octave %d\n', octave ); 
end 
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for interval = 2:(1ntervals-1) 
keypoint count — 0; 
contrast mask = abs(DOG pyr{octave}(:,:,interval)) >= contrast threshold; 
loc(octave,interval] = zeros(size(DOG pyr(octavej (:,:,interval))); 
if exist('corrsep') == 
edge = I; 
else 
edge = ceil(filter size(octave,interval)/2); 
end 
for yz«(1-*edge):(size(DOG pyr(1octavej (:,:,interval),1)-edge) 
for x«(1-edge):(size(DOG pyr(íoctave)(:,:,interval),2)-edge) 


if object mask(round(y*subsample(octave)),round(x*subsample(octave))) == 1 


if( (interactive >= 2) | (contrast mask(y,x) == 1) ) 





% iE A [RISE UI Po NEC Ee] NER 
DOG pyríoctavej((y-1):(y-1),(x- 1): (x1), (interval-1):(interval--1)); 
pt val = tmp(2,2,2); 
if( (pt val == min(tmp(:))) | (pt val == max(tmp(:))) ) 








% TETIOSEIKISEAK-TOSE EEE BR TERCER Ex] As 


raw keypoints = [raw keypoints; x*subsample(octave) y*subsample(octave) ]; 
if abs(DOG pyríoctave](y,x,interval)) >= contrast threshold 


contrast keypoints = [contrast keypoints; raw keypoints(end,:)]; 


% 计算 局 部 极 值 的 Hessian XB RE 
Dxx = sum(DOG pyríoctavej(y,x-1:x--1 interval) .* xx); 
Dyy = sum(DOG pyr(1octavej(y-1:y-*-1,x,interval) .* yy); 
Dxy = sum(sum(DOG pyr1octavej (y-1:y--1,x-1:x4- 1 interval) .* xy)); 


% 计算 Hessian 算 阵 的 下 迹 和 行列 式 . 


Tr H= Dxx + Dyy; 
Det H= Dxx*Dyy - Dxy^2; 


% 计算 主 曲率 . 
curvature ratio = (Tr H^2)/Det H; 


if ((Det H >= 0) & (curvature ratio < curvature threshold)) 


% fff: HH E^ BO TELE BAUER. SU AA GELA) 


curve keypoints = [curve keypoints; raw keypoints(end,:)]|; 
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% 将 该 点 的 位 置 的 坐标 设 为 1， 并 计算 点 的 数量 . 
loc foctave,interval](y,x) = 1; 
keypoint count = keypoint count + 1; 
end 
end 





end 
end 
end 
end 
end 
if interactive >= 1 
fprintf( 2, \t\t%d keypoints found on interval %d\n', keypoint count, interval ); 
end 
end 
end 
keypoint time = toc; 
if interactive >= 1 
fprintf( 2, 'Keypoint location time %.2f seconds. n', keypoint time ); 
end 


% 在 交互 模式 下 显示 特征 点 检测 的 结 来 
if interactive >= 2 
fig = figure; 
clf: 
imshow(im); 
hold on; 
plot(raw keypoints(:;,1),raw keypoints(:,2),'y--); 
resizeImageFig( fig, size(1m), 2 ); 
fprintf( 2, 'DOG extrema (2x scale).nPress any key to continue. Wn' ); 
pause; 
close(fig); 
fig = figure; 
clf: 
imshow(im); 
hold on; 
plot(contrast keypoints(:,1),contrast keypoints(:,2),'y--); 
resizeImageFig( fig, size(1m), 2 ); 
fprintf( 2, 'Keypoints after removing low contrast extrema (2x scale). nPress any key to continue. Wn' ); 
pause; 
close(fig); 
fig = figure; 
clf: 
imshow(im); 
hold on; 
plot(curve keypoints(:,1),curve keypoints(:,2),'y--); 
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resizeImageFig( fig, size(1m), 2 ); 
fprintf( 2, 'Keypoints after removing edge points using principal curvature filtering (2x scale). nPress 


any key to continue. n' ); 


pause; 
close(fig); 
end 
clear raw keypoints contrast keypoints curve keypoints 
%%%%%% 下 一 步 是 计算 特征 点 的 主 方 回 %%%%%% 
% 在 特征 点 的 一 个 区 域内 计算 其 梯度 直方 图 


g = gaussian filter( 1.5 * absolute sigma(l,ntervals+3)/ subsample(1) ); 





zero pad = ceil( length(g) / 2 ); 


% 计算 高 斯 金字 塔 图 像 的 梯度 方向 和 幅 值 
if interactive >= 1 
fprintf( 2, Computing gradient magnitude and orientation...^n' ); 
end 
tic; 
mag thresh = zeros(size(gauss pyr)); 
mag pyr = cell(size(gauss pyr)); 
grad pyr- cell(size(gauss pyr)); 
for octave = l:octaves 
for interval = 2:(intervals--1) 


% 计算 xy 的 天 分 
diff x = O.5*(gauss pyr{octave,interval}(2:(end-1),3:(end))-gauss pyr{octave,nterval}(2:(end- 


1),1:(end-2))); 


diff y = O.5*(gauss pyr1octave,interval] (3:(end),2:(end-1))-gauss pyr[íoctave,interval | (1:(end- 


2),2:(end-1))); 





% 计算 标 友 幅 值 
mag = zeros(size(gauss pyr{octave,1nterval})); 
mag(2:(end-1),2:(end-1)) = sqrt( diff x .^ 2 + diff y .^ 2 ); 


% Fin UTE T A BE UE 
mag pyr(octave,interval) = zeros(size(mag)*2*zero pad); 
mag pyr{octave,interval}((zero pad-*1):(end-zero pad)(zero pad-1):(end-zero pad)) = mag; 





% 计算 梯度 主 方 问 

grad = zeros(size(gauss pyr{octave,nterval})); 
grad(2:(end-1),2:(end-1)) = atan2( diff y, diff x ); 
grad(find(grad == pi)) = -pi; 


% 存储 高 斯 金字 塔 梯度 主 方 问 
grad pyr{octave,interval} = zeros(size(grad)+2*zero pad); 





grad pyr{octave,interval}((zero pad-1):(end-zero pad),(zero pad+1):(end-zero pad))= grad; 
end 
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end 
clear mag grad 
grad time - toc; 
if interactive >= 1 
fprintf( 2, 'Gradient calculation time %.2f seconds.\n', grad time ); 
end 





%%%%%% 下 一 步 是 确定 特征 点 的 主 方 同 %%%%%% 

%%%%%% 方法 : 通过 寻找 每 个 关键 点 的 子 区 域内 梯度 直方 图 的 峰值 %%%%%% 
% 将 灰 度 直方 图 分 为 36 等 分 ， 每 隔 10 度 一 份 

num bins = 36; 

hist step = 2*pi/num bins; 

hist orient = [-pi:hist step:(pi-hist step)]; 


% D REESE. Zr MRE A 


pos = []; 
orient — []; 
scale = [|]; 





% 给 关键 点 确定 主 方 问 
if interactive >= 1 
fprintf( 2, 'Assigining keypoint orientations...\n' ); 
end 
tic; 
for octave = 1:0ctaves 
if interactive >= 1 
fprintf( 2, \tProcessing octave %d\n', octave ); 
end 
for interval = 2:(intervals + 1) 
if interactive >= 1 
fprintf( 2, NtProcessing interval %d ', interval ); 
end 
keypoint count — 0; 


% 构造 高 斯 加 权 掩 模 

g = gaussian filter( 1.5 * absolute sigma(octave,interval)/subsample(octave) ); 
hf sz = floor(length(g)/2); 

g-g"*g, 


loc pad = zeros(size(loc[octave,interval])*-2*zero pad); 
loc pad((zero pad-1):(end-zero pad),(zero pad-1):(end-zero pad)) = loc (octave,interval] ; 


[iy ix|-find(loc pad--1); 
for k = I:length(iy) 


x = Ix(k); 
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y = iy(k); 

wght = g.*mag pyr{octave,interval}((y-hf sz):(y+hf sz),(x-hf sz):(x+hf sz)); 

grad window = grad pyr{octave,interval}((y-hf sz):(y+hf sz),(x-hf sz):(x+hf sz)); 
orient hist-zeros(length(hist orient),1); 

for bin-l:length(hist orient) 


diff = mod( grad window - hist orient(bin) + pi, 2*pi ) - pi; 


orient hist(bin)-orient hist(bin)*sum(sum(wght.*max(1 - abs(diff)/hist step,0))); 


end 





% 运用 非 极 大 抑制 法 查找 主 方 回 直 方 图 的 峰值 
peaks = orient hist; 

rot right = [ peaks(end); peaks(1:end-1) |; 

rot left = [ peaks(2:end); peaks(1) |; 

peaks( find(peaks < rot right) ) = 0; 

peaks( find(peaks < rot left) ) = 0; 








% 提取 最 大 峰值 的 值 和 其 索引 位 置 


[max peak val ipeak] = max(peaks); 





% 将 大 于 等 于 最 大 峰值 80% 的 直方 图 的 也 确定 为 特征 点 的 主 方 问 
peak val = max peak val; 
while( peak val > 0.8*max peak val) 





% 最 局 峰值 最 近 的 三 个 柱 值 通过 抛物 线 插值 精确 得 到 


forj = -1:1 
A = [A; (hist orient(ipeak)+hist step*]).^2 (hist orient(ipeak)+hist step*]) 1]; 
bin = mod( ipeak +j + num bins - 1, num bins )+ 1; 
b = [b; orient. hist(bin)]; 
end 
c = pinv(A)*b; 
max orient = -c(2)/(2*e(1)); 
while( max orient < -pi ) 
max orient = max orient + 2*pi; 
end 
while( max orient >= pi ) 
max orient — max orient - 2*pi; 


end 


Vo 存储 关键 点 的 位 置 、 主 方向 和 尺度 信息 
pos = [pos; [(x-zero pad) (y-zero_pad)]*subsample(octave) |; 
orient = [orient; max orient]; 
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scale = [scale; octave interval absolute sigma(octave,interval)]; 
keypoint count = keypoint count + 1; 


peaks(ipeak) = 0; 
[peak val ipeak] = max(peaks); > 
end 
end 
if interactive >= 1 
fprintf( 2, (od keypoints)\n', keypoint count ); 
end 
end 
end 
clear loc loc pad 
orient time = toc; 
if interactive >= 1 
fprintf( 2, 'Orientation assignment time %.2f seconds. n', orient time ); 


end 





% TEACH BAN MERKER JS SEU 37 I8] fei A 
if interactive >= 2 
fig = figure; 
clf; 
imshow(im); 
hold on; 
display keypoints( pos, scale(:,3), orient, 'y' ); 
resizeImageFig( fig, size(1m), 2 ); 
fprintf( 2, 'Final keypoints with scale and orientation (2x scale). nPress any key to continue. n' ); 
pause; 
close(fig); 
end 








%%%%%% SIFT 算法 的 最 后 一 步 是 特征 丫 量 生成 %%%%%6% 
orient bin spacing = pi/4; 
orient angles = [-pi:orient bin. spacing:(pi-orient bin spacing)]; 


grid spacing — 4; 

[x coords y coords]| = meshgrid( [-6:grid spacing:6] ); 

feat grid = [x coords(:) y coords(:)]; 

[x coords y coords| = meshgrid( [-(2*grid spacing-0.5):(2*grid spacing-0.5)] ); 
feat samples = [x coords(:) y coords(:)]; 

feat window = 2*grid spacing; 


desc = []; 


if interactive >= 1 
fprintf( 2, 'Computing keypoint feature descriptors for %d keypoints', size(pos,1) ); 
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end 

for k = 1:size(pos,1) 
x = pos(k,1)/subsample(scale(k,1)); 
y = pos(k,2)/subsample(scale(k, 1)); 


% 将 坐标 轴 旋 转 为 天 键 点 的 方 辐 ， 以 确保 旋转 不 变性 

M = [cos(orient(k)) -sin(orient(k)); sin(orient(k)) cos(orient(k))]; 
feat rot grid = M*feat grid + repmat([x; y],l,size(feat grid,2)); 

feat rot samples = M*feat samples + repmat([x; y],l,size(feat samples,2)); 


% 初始 化 特征 问 量 . 
feat desc = zeros(1,128); 


fors = L:size(feat rot samples,2) 
x sample = feat rot samples(1,s); 
y sample = feat rot samples(2,s); 





% 在 采样 位 置 进行 梯度 插值 
[X Y] = meshgrid( (x_sample-1):(x_sample+1), (y sample-1):(y sample-1) ); 
G = interp2( gauss _pyr{scale(k,1),scale(k,2)}, X, Y, '*linear' ); 
G(find(isnan(G))) = 0; 
diff x = 0.5*(G(2,3) - G(2,1)); 
diff y 20.5*(G(3,2) - G(1,2)); 
mag sample = sqrt( diff x^2 + diff y^2 ); 
grad sample = atan2( diff y, diff x ); 
if grad sample == pi 
grad sample = -pi; 
end 


% 计算 xX、y 方 向 上 的 权重 

x wght = max(l - (abs(feat rot grid(1,:)-x sampleygrid spacing), 0); 
y weht= max(1 - (abs(feat rot grid(2,:) - y sample)/grid spacing), 0); 
pos wght = reshape(repmat(x wght.*y wght,8,1),1,128); 


diff = mod( grad sample - orient(k) - orient angles + pi, 2*pi ) - pi; 
orient wght = max(1 - abs(diff)'orient bin spacing,O); 
orient wght = repmat(orient wght,1,16); 


% 计算 高 斯 权重 
g=exp(-((X Sample-X)^2+(Y sample-y)^2)/(2*feat window^2))/(2*pi*feat window^2); 


feat desc = feat desc + pos wght.*orient wght*g*mag sample; 
end 
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% 将 特征 问 量 的 长 度 归 一 化 ， 则 可 以 进一步 去 际 光 照 变 化 的 影响 . 


feat desc = feat desc / norm(feat desc); 


feat desc( find(feat desc > 0.2) ) = 0.2; 
feat desc — feat desc / norm(feat desc); > 


% 存储 特征 问 量 . 
desc = [desc; feat desc]; 
if (interactive >= 1) & (mod(k,25) == 0) 
fprintf( 2, '.' ); 
end 
end 
desc time - toc; 


% 调整 采样 偏差 
sample offset = -(subsample - 1); 
for k = 1:size(pos,1) 
pos(k,:) = pos(k,:) + sample offset(scale(k,1)); 
end 


if size(pos,1) > 0 
scale — scale(:,3); 
end 








% 在 交互 模式 下 显示 运行 过 程 耗 时 . 
if interactive >= 1 
fprintf( 2, ^aDescriptor processing time %.2f seconds.\n', desc time ); 
fprintf( 2, 'Processing time summary: Wn! ); 
fprintf( 2, \tPreprocessing:\t%.2f s\n', pre. time ); 
fprintf( 2, Pyramid: VX96.2f s\n', pyr. time ); 
fprintf( 2, \tKeypoints:\t%.2f s\n', keypoint. time ); 
fprintf( 2, \tGradient:\t%.2f s\n', grad. time ); 
fprintf( 2, \tOrientation:\t%.2f s\n', orient. time ); 
fprintf( 2, \tDescriptor:\t%.2f s\n', dese. time ); 
fprintf( 2, 'Total processing time 96.2f seconds. n', pre time + pyr time + keypoint time + grad time 
+ orient time + desc time ); 


end 
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在 上 述 实现 SIFT 算法 的 MAILAB 程序 中 ， 调 用 了 其 他 一 些 函 数 如 下 。 
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function g = gaussian filter( sigma) 


% 功能 : 生成 一 维 高 斯 滤波 器 
% 输入 : 
% sigma — 局 斯 滤波 器 的 标准 差 
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% 输出 : 
% g- 高 斯 滤波 器 


sample = 7.0/2.0; 
n = 2*round(sample * sigma)-1; 


x-]:n; 
x—x-ceil(n/2); 


g = exp(-(x.^2)/(2*sigma^2))/(sigma*sqrt(2*p1)); 
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function im = pgmread( fname ); 
% 功能 : 谈 入 .pgm 图 像 


global SIZE LIMIT; 
if SIZE LIMIT 

fprintf(1, SIZE LIMIT recognized by pgmread n"); 
end 


[fid,msg] = fopen( fname, 'r' ); 


if (fid — -1) 
error(msg); 
end 


[pars type]- pnmReadHeader(fid); 
if (pars-—-1) 

fclose(fid); 

error([fname ': cannot parse pgm header ]); 
end 


if -(type == 'P2' | type == 'P5)) 
fclose(fid); 
error([fname ': Not of type P2 or P5.']); 
end 


xdim - pars(1); 
ydim = pars(2); 
maxval = pars(3); 


sz = xdim * ydim; 


if SIZE LIMIT 
if sz >= 16384 
ydim = floor(16384/xdim); 


sz = xdim * ydim; 
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fprintf(1, 'truncated image size: cols %d rows %d\n', xdim, ydim) 
end 
end 


if (type == 'P2') 
[im,count| = fscanf(fid, /od',sz); 
elseif (type == 'P5") 





count — 0; 
im = []; 
stat = fseek(fid, -sz, 'eof); 
if ~stat 
[im,count] = fread(fid,sz,'uchar); 
end 


if (count ~= sz) 
fprintf( 1, Warning: File ended early! %s\n', fname); 
fprintf(1,'...Padding with 9od zeros. n', sz-count); 
im = [im ; zeros(sz-count,1)]; 


end 


else 

fclose(fid); 

error([fname ': Not of type P2 or P5.']); 
end 


im = reshape( im, xdim, ydim )'; 
fclose(fid); 
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function [pars, type|- pnmReadHeader(fid) 
% 功能 : 谈 入 并 解析 一 个 pnm 格式 图 像 的 头 文件 


pars — -1; 
type = 'Unknown'; 


TheLine = feetl(fid); 
szLine = size(TheLine); 
endLine = szLine(2); 


if (endLine « 2) 
fprintf( 1, ['Unrecognized PNM file typeW' |); 
pars = -1; 


return; 








f MATLAB s::255:9x 





end 


type = TheLine(1:2); 
ok = 0; 
if (type(1) == 'P") 
if (type(2) == '1' | type(2) — '2' | ... 
type(2) == '3' | type(2) == 4 | ... 
type(2) == '5' | type(2) == '6' | ... 
type(2) — 'B' | type(2) == 'L') 
ok= 1; 
else 
fprintf(1, |'Unrecognized PNM file type: ' type ^n']); 
end 
end 
if (type(1) == 'F)) 
if (type(2) == 'P' |type(2) == 'U") 
ok= 1; 
else 
fprintf(1, |'Unrecognized PNM file type: ' type ^n']); 
end 
end 


if ~ok 
pars — -1; 
return; 


end 


current — 3; 
parIndex-1; 
while(parIndex « 4) 
while (current > endLine) 
TheLine = feetl(fid); 
if (TheLine == -1) 
fprintf( 1, Unexpected EOF WM); 
pars = -1; 
return; 
end 
szLine = size(TheLine); 
endLine = szLine(2); 
current — 1; 


end 


[token, count, errmsg, nextindex] - ... 
sscanf( TheLine(current:endLine), "os", 1); 


nextindex = nextindex-current-1; 
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if (count==0) 
if (nextindex > endLine) 
current — nextindex; 
else 
pars = -1; 
fprintf( 1, Unexpected EOF Wn); 


return; 





end 
else 


if token(1) == '#' 
current = endLine-*1; 
else 
[pars(parIndex), count, errmsg, nextindex | = ... 
sscanf(TheLine(current: endLine), 'vod', 1); 
if -(count—1) 
fprintf( 1,'Confused reading pgm header n); 
pars=-1; 
return; 
end 
parIndex = parIndex-1; 
current = current-nextindex-1; 


end 


end 


end 
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function resizeImageFig(h, sz, frac) 
% function resizeImageFig(h, sz, frac) 
% 功能 : 根据 句柄 重 获 图 像 的 大 小 
% sz— KERT. 

% frac (默认 值 = 1). 


if (nargin <3) 
frac = 1; 
end 


pos = get(h, 'Position"); 
set(h, 'Units', 'pixels', 'Position', ... 
[pos(1), pos(2)*pos(4)-frac*sz(1), ... 
frac*sz(2), frac*sz(1)]); 
set(gca,'Position', [0 0 1 1], 'Visible', 'off'); 
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function hh = display keypoints( pos, scale, orient, varargin ) 


vo 功能 : 在 原始 图 像 上 显示 特征 点 
% 输入 : 

% pos — 特征 点 的 位 置 矩 阵 . 

% scale -特征 点 的 尺度 矩阵 . 

% orient EFE E If] 3:77 In] [n] 3. 

2% 输出 : 

% hh- 返 回 向 量 的 线 句 柄 . 





hold on; 


alpha = 0.33; 
beta = 0.33; 
autoscale = 1.5; 
plotarrows = 1; 


=M 
sym — ; 


filled = 0; 


varin — nargin - 3; 


while (varin > 0) & isstr(varargin | varin] ), 
vv = varargin {varin}; 
if -isempty(vv) & stremp(lower(vv(1)),'f) 
filled = 1; 
nin — nin-1; 
else 
[l,c,m,msg] = colstyle(vv); 
if -isempty(msg), 
error(sprintf('Unknown option "96s".',vv)); 
end 
if -isempty(l), Is = I; end 
if -isempty(c), col = c; end 
if -isempty(m), ms = m; plotarrows = 0; end 
if isequal(m,'.'), ms = "; end % Don't plot '.' 
varin — varin-1; 
end 
end 
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if varin > 0 


autoscale = varargin {varin}; 


end 
x = pos(:,1); 
y = pos(:,2); 





u = scale.*cos(orient); 


v = scale.*sin(orient); 


if prod(size(u))==1, u = u(ones(size(x))); end 
if prod(size(v))==1, v = v(ones(size(u))); end 


if autoscale, 
u = u*autoscale; v = v*autoscale; 
end 


ax = newplot; 
next = lower(get(ax, NextPlot')); 
hold state = ishold; 


x—-x()5y -y()^5 
u-u(:).5v-v(:).5 
uu = [x;ix*u;repmat(NaN,size(u)) |; 
vv = [y;y*v;repmat(NaN,size(u))]; 


hl = plot(uu(:),vv(:),[col Is]); 


if plotarrows, 
hu = [x+u-alpha*(u+beta*(v+eps));x+u; ... 
x-u-alpha*(u-beta*(v--eps));repmat(NaN,size(u))]; 
hv = [y7v-alpha*(v-beta*(u-eps));y-v; ... 
y-tv-alpha*(v-Fbeta*(u--eps));repmat(NaN,size(v))]; 


hold on 

h2 = plot(hu(:),hv(:),[col Is]); 
else 

h2 = []; 
end 
if -isempty(ms), 

hu = x; hv = y; 

hold on 


h3 = plot(hu(:),hv(:),[col ms]); 

if filled, set(h3,'markerfacecolor',get(h1,'color')); end 
else 

h3 =[]; 
end 
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if ~hold state, hold off, view(2); set(ax,'NextPlot',next); end 


if nargout^0, hh = [h1;h2;h3]; end 
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| 经验 分 享 ， 特 征 点 描述 向 量 提取 与 匹配 | 
DOO 当 检 测 出 特征 点 之 后 ， 由 于 一 个 点 的 信息 量 有 限 ， 一 般 提取 其 周围 领域 的 特征 (如 | 
| 友 度 特征 、 梯 度 特 征 等 ) 组 成 向 量 ， 作 为 该 点 的 描述 向 量 ， | 
1 所 谓 匹配 就 是 根据 某 一 准则 ( 如 均 方 根 误差 、 差 绝对 值 和 误差 、 向 量 距离 、 相 似 
| 度 )， 查 寻 使 该 准则 最 小 的 两 列 特征 向 量 对 应 的 点 ， 组 成 特征 点 。 通 常情 况 下 ， 特 征 向 | 


| 量 维 数 越 高 ， 匹 配 时 间 越 长。 | 


45 SURF 特征 提取 与 描述 


如 条 说 SIFT 算法 中 使 用 DoG 对 LoG 进行 了 人 简化， 提高 了 搜索 特征 点 的 速度 ， 那 么 ， 
Bay 等 人 提出 的 SURF CSpeeded Up Robust Features, SURF) 算法 ， 则 是 对 DoH 
(Determinant of Hessian, DoH) 的 简化 和 近似 。 虽 然 Lowe 的 SIFT 算法 已 被 认为 是 最 有 效 、 
也 是 最 第 用 的 特征 点 提取 算法 ， 但 如 来 不 便 助 于 便 件 的 加 速 和 专用 图 形 处 理 右 的 配合 ，SIFT 
算法 在 现 有 的 计算 机 性 能 条 件 下 仍然 很 难 达到 实时 的 程度 。 而 对 于 需要 实时 运算 的 场合 ， 如 
导弹 寻 的 制导 时 的 目标 识别 ， 通 党 需要 在 量 秒 级 内 完成 特征 点 搜索 、 特 征 矢量 生成 、 特 征 矢 
量 匹配 、 目 标 锁定 等 工作 ，SIFT 算法 则 难以 满足 。SURE 借鉴 了 SIFT 中 简化 近似 的 思想 ， 
将 DoH 中 的 高 斯 二 阶 微分 模板 进行 了 近似 简化 ， 使 得 模板 对 图 像 的 滤波 只 需要 进行 几 个 简 
单 的 加 减法 运算 ， 并 且 这 种 运算 与 滤波 模板 的 太 寸 无 天 。 实 验证 明 ，SUREF 算法 较 SIFT 在 
运算 速度 上 要 快 3 倍 左右 ， 综 合 性 能 要 优 于 SIFT 算法 。 


4.5.1 积分 图 像 





























SURF 算法 中 要 用 到 积分 图 像 的 概念 。 借 助 积 分 图 像 ， 图 像 与 高 斯 二 阶 微 分 模板 的 滤 沁 
转化 为 对 积分 图 像 的 加 减 运算 。 积 分 图 像 (Integral image) 的 概念 是 由 Viola 和 Jones 提出 来 
的 ， 而 将 类 似 积 分 图 像 用 于 盒子 滤波 (Box Filter) 却 是 Simard 等 人 提出 来 的 。 

积分 图 像 中 任 苇 一 点 (i j) E ifi, 站 为 原 图 像 左 上 角 到 任 总 点 (i, 让 相应 的 对 角 线 区 域 灰 
FERAM, BE 














i(i, j)= ^, pj) 


AP, p(i", j^) 表示 原 图 像 中 点 G, 门 WAKE. iili, j) PTH FARAR 
S(i, j)= S(i, j - 1) * p(i, j) 
i(i, j) - ii(i ^ 1, j)+ S(i, j) 

P, Sj) 表示 一 列 的 积分 ， 且 SG,-)020. ü(-1j) 20. KEDRA, RANER 
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像 所 有 像素 进行 一 过 扫 摘 。 
如 图 4-25 所 示 ， 在 求 取 窗口 W 内 的 像 元 灰 度 和 时 ， 不 管 窗口 W 的 大 小 如 何 ， 均 可 以 
用 积分 图 像 的 4 ISHINERR QR). Gh) GA GU ZO 的 值 计 算得 到 。 也 就 是 说 ， 求 取 
O W 内 的 像 元 灰 度 和 与 窗口 的 尺寸 是 无 天 的 。 窗 口 W 内 像 元 的 灰 度 和 为 
六 











图 4-25 积分 图 像 计 算 和 W 窗口 内 像 元 的 灰 度 求 和 计算 








假设 有 一 灰 度 值 均 为 1 的 图 像 ， 那 么 该 图 像 中 任 一 点 (人 7 的 积分 图 像 值 实际 就 是 图 像 
左上 角 点 到 任 一 点 (i, 站 构成 的 矩形 区 域 面 积 ( 像 元 数 ) 的 大 小 。 > ,就 是 由 W 构成 的 矩形 
框 包含 的 面积 。 

给 定 图 像 了 中 一 个 点 x(x,y) ， 在 点 x 处， 尺度 为 o 的 Hessian 算 阵 五 (x,o) 定 义 如 下 。 


L.(x,0) Ly (x,0) 
L(x,0) L,(x,o0) 








aeo-| 


2 
RP, Lao) 是 高 斯 二 阶 微分 eo) 在 点 x 处 与 图 像 了 WER, Lyo) 和 
X 


L, G0) 具有 同样 的 含义 。 

由 于 二 阶 高 斯 微分 模板 被 离散 化 和 剪裁 的 原因 ， 导 致 了 图 像 在 旋转 奇数 倍 的 z/4 时 ， 即 
转动 到 模板 的 对 角 线 方向 时 ， 特 征 点 检测 的 重复 性 (Repeatability) 降低 。 而 在 r/2 时 ， 特 
征 点 检测 的 重复 性 最 高 。 但 这 一 不 足 不 影响 使 用 Hessian 矩阵 进行 特征 点 检测 。 

为 了 将 模板 与 图 像 的 卷 积 转化 成 盒子 滤波 (Box Filter) 运算 ， 需 要 对 高 斯 二 阶 微分 模板 
进行 简化 ， 使 得 简化 后 的 模板 只 是 由 儿 个 矩形 区 域 组 成 ， 矩 形 区 域内 填充 同一 值 ， 如 图 4-26 
所 示 ， 在 简化 模板 中 白色 区 域 的 值 为 1， 黑 色 区 域 的 值 为 -1， 灰 色 区 域 的 值 为 0。 

对 于 Go =1.2 的 高 斯 二 阶 微分 滤波 ， 设 定 模板 的 尺寸 为 9x9 的 大 小 ， 并 用 它 作为 最 小 尺 
度 空间 值 对 图 像 进行 滤波 和 斑点 检测 。 使 用 D,。、D,, MD, 表示 模板 与 图 像 进行 卷 积 的 结 
果 ， 这 样 便 可 将 Hessian 矩阵 的 行列 式 作 如 下 简化 。 
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4-26 高 斯 二 阶 微分 模板 以 及 简化 


2 2 
a) Ly = rg b) ,的 简化 c) Ly ^ ai; (0) d) L, 的 简化 


Det(H) 2 LL. -LL 












































XX TY XY XY 
L L L 
Z Pw x p —— =I) W D, XE 
D, ii Dy 7 Dy . Dy 
L L L, L 
=DD ex )-» E z) 
YY 5 Dy V V| D Dy 
Dx D Dy Dy 
= zl Ly bs IE ze Ly 
Dy Do J\ La Ly D. 
-(A- BY)C 
| L,(1.2)|, |DO]; MED 
式 中 ， 了 = 一 一 一 个 一 一 一 =0.912 半 0.9，|X|, 为 Frobenius 范 数 。 理 论 上 讲 ， 对 于 不 








L,(1.2)|; |D,, (9). 
IH] c 值 和 对 应 的 模板 尺寸 ，7 值 是 不 同 的 ， 但 为 了 人 窗 化 起 见 ， 可 以 认为 它 是 一 个 单数 。 同 
样 ， 也 可 以 认为 C 为 常数 ， 由 于 和 常数 C 不 影响 对 于 极 大 值 求 取 ， 因 此 ， 便 有 

Det(H prox) = D4D,, -(0.9D,.) 


approx Xx yy 


MT, EKEREN NVE H m REST JN ST ARO 进行 归 一 化 处 理 ， 以 保证 
使 用 一 个 统一 的 Frobenius 范 数 能 适应 所 有 的 小 波 矿 寸 。 如 对 于 9x9 模板 的 L, 和 二, 盒子 的 


面积 为 15， 工 , 的 盒子 面积 为 9。 一 般 而 言 ， 如 果 盒子 内 部 填充 值 为 e(lL-L-21. fou 
应 的 四 个 角 点 积分 图 像 值 为 {pr?,p2, pipi] 盒子 面积 分 别 为 sw Sy Cs m5, ) 和 sw ， 
那么 ， 盒 子 滤波 啊 应 值 为 


























l 2 n n n n n 
Dx = v (P4 — Pa — P3 tn) 
XX n=l 
1 3 
D, - — M» v" (pi - p5 — P + pi) 
Nm 
Xy n=l 
1 4 
Do -— 5 V (i - P; -P3 + Pr) 


Xy n=l 
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A Dar Dy 和 DD, 的 计算 公式 可 以 看 出 ， 它 们 的 运算 量 与 模板 的 尺寸 是 无 关 的 。 计 算 
D, MD, RA 12 次 加 减法 和 4 次 乘法 ， 计 算 D, 只 有 16 次 加 减法 和 5 次 乘法 。 

使 用 近似 的 Hessian FERETI A RRR ELER TP ARS x 处 的 斑点 啊 应 值 ， 明 历 图 像 中 所 
有 的 像 元 点 ， 便 形成 了 在 茶 一 尺度 下 斑点 检测 的 咽 应 图 像 。 使 用 不 同 的 模板 尺寸 ， 便 形成 了 
多 尺度 斑点 啊 应 的 金字 塔 图 像 ， 利 用 这 一 金子 塔 图 像 ， 就 可 以 进行 斑点 啊 应 极 值 点 的 搜索 ， 
其 过 程 完全 与 SIFT 算法 类 同 。 


4.5.3 尺度 空间 表示 


通常 要 想 获 取 不 同 尺度 的 斑点 ， 必 须 建立 图 像 的 尺度 空间 金字 塔 。 一 般 的 方法 是 通过 采 
用 不 同 o 的 高 斯 函数 ， 对 图 像 进 行 平 清 滤波 ， 然 后 ， 重 采样 网 像 以 获得 更 高 一 层 的 金字 塔 岁 
像 。Lowe 在 SIFT 方法 中 束 是 通过 相 令 两 层 图 像 金 字 塔 相 减 得 到 DOG 图 人像， 然后 再 在 DOG 
图 像 上 进行 斑点 和 边缘 检测 工作 的 。 

由 于 采用 了 盒子 滤波 和 积分 网 像 ， 所 以 并 不 需要 像 SIFT 算法 那样 去 直接 建立 图 像 金字 
塔 ， 而 是 采用 不 断 增 大 盒子 滤波 模板 尺寸 的 间接 方法 。 通 过 不 同 尺 寸 盒 子 滤波 模板 与 积分 疼 
像 求 取 Hessian 矩阵 行列 式 的 啊 应 网 像 ， 然 后 ， 在 啊 应 网 像 上 采用 3D 非 最 大 值 抑制 ， 求 取 
各 种 不 同 尺 度 的 斑点 。 

如 前 所 述 ， 使 用 9x9 的 模板 对 图 像 进行 滤波 ， 其 结果 作为 最 初始 的 尺度 空间 层 〈 此 时 ， 
尺度 值 s=1.2， 近 似 o =1.2 的 高 斯 微分 )， 后 续 的 层 将 通过 逐步 放大 滤波 模板 尺寸 ， 以 及 放 
大 后 的 模板 不 断 与 图 像 进 行 滤 波 得 人 到。 由 于 采用 盒子 滤波 和 积分 图 像 ， 滤 波 过 程 并 不 随 看 滤 
波 模板 尺寸 的 增加 而 使 运算 工作 量 增加 。 

与 SIFT 算法 类 似 ， 我 们 需要 将 尺度 空间 划分 成 唇 干 组 (Octaves)。 一 个 组 代表 了 逐步 
放大 的 滤波 模板 对 同一 输入 图 像 进行 滤波 的 一 系列 啊 应 图 。 每 个 组 又 由 辱 干 固定 的 层 组 成 。 
由 于 积分 图 像 离散 化 的 原因 ， 两 个 层 之 间 的 最 小 尺度 变化 量 是 由 高 斯 二 阶 微分 滤波 器 在 微分 
方 回 上 对 正 旬 斑点 啊 应 长 度 1 决定 的 ， 它 是 盒子 滤波 模板 尺寸 的 1/3。 对 于 9x9 的 盒子 滤波 
模板 ，h 为 3。 下 一 个 层 的 啊 应 长 度 至 少 应 该 在 1, 的 基础 上 增加 2 个 像 元 ， 以 保证 一 边 一 个 



















































































像 元 ， 即 1 =5， 这 样 ， 模 板 的 尺寸 就 为 15x15 ， 如 图 4-27 所 示 。 以 此 类 推 ， 可 以 得 到 一 个 
尺寸 逐渐 增 大 模板 序列 ， 它 们 尺寸 分 别 为 : 9x9, 15x15, 21x21, 27x27, 39x39, 
色 、 白 色 区 域 的 长 度 增加 侦 数 个 像 元 ， 以 保证 一 个 中 心 像 元 的 存在 。 

MB IR IR RR ER ERU DIT 





图 4-27 ”滤波 模板 D fI D. 尺寸 从 9x9 增 大 到 15x15 时 的 变化 
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采用 类 似 的 方法 来 处 理 其 他 组 的 模板 序列 。 其 方法 是 将 滤波 器 尺寸 增加 量 翻 倍 〈6、 
12、24、48)。 这 样 ， 可 以 得 到 第 二 组 的 滤波 占 尺 寸 ， 它 们 分 别 为 15. 27. 39. 51; 第 三 组 
的 滤波 器 尺寸 为 27、51、75、99。 如 果 原 始 图 像 尺 寸 仍然 大 于 对 应 的 滤波 器 尺寸 ， 尺 度 空 间 
的 分 析 还 可 进行 第 四 组 ， 其 对 应 的 模板 尺寸 分 别 是 51、99、147 和 195。 图 4-28 给 出 了 第 一 
到 第 三 个 组 的 滤波 器 尺寸 变化 的 图 形 表 示 。 对 数 水 平 轴 代表 尺度 ， 组 之 间 有 相互 重 登 ， 其 目 
的 是 为 了 复 兰 所 有 可 能 的 尺度 。 在 通 种 尺度 分 析 情 况 下 ， 随 看 尺度 的 增 大 ， 被 检测 到 的 斑点 
数量 迅速 衰减 。 与 此 同时 ， 为 了 减少 运算 量 ， 提 高 计算 的 速度 ， 可 以 考虑 在 滤波 时 ， 将 采样 
间隔 设 为 2” 。 
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1 2 4 8 尺度 
图 4-28 三 个 不 同 组 的 滤波 器 尺寸 的 图 形 化 表示 


仿照 SIFT 算法 ， 涯 小 啊 应 长 度 h AAF L. HEU] o、 层 索引 a KELLA 
的 相互 天 系 为 
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a) 
图 4-29 AEREE IE ASSI REMER 
a) 尺寸 为 15 
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c) 
图 4-29 不 同 尺 寸 时 的 滤波 器 模板 的 图 形 化 表示 〈 续 ) 
b) 尺寸 为 21 e) 尺寸 为 27 


ZEE SURF 特征 描述 算 子 


SIFT 特征 描述 算 子 在 生成 特征 矢量 时 使 用 的 是 高 斯 赂 像 ， 而 SURF 特征 描述 子 在 生成 
特征 矢量 使 用 的 则 是 积分 图 像 。 这 样 做 的 目的 束 是 要 充分 利用 在 特征 点 检测 时 形成 的 中 间 结 
果 “〈 积 分 图 像 )， 避 免 在 特征 矢量 生成 时 对 图 像 进 行 重复 运算 。 

为 了 保证 特征 矢量 具有 旋转 不 变性 ， 与 SIFT 算法 一 样 ， 需 要 对 每 个 特征 点 分 配 一 个 主 
方向 。 为 此 ， 要 在 以 特征 点 为 中 心 ， 以 6s Cs 为 特征 点 的 尺度 ) 为 半径 的 圆 形 区 域内 ， 对 图 
像 进行 Haar 小 波 啊 应 运算 。 

在 SIFT 特征 描述 算 子 中 ， 在 求 取 特征 点 主 方向 时 ， 是 以 特征 点 为 中 心 ， 在 以 4.50o 为 半 
径 的 邻 域 内 计算 梯度 方向 直方 图 的 。 事 实 上 ， 两 种 方法 在 求 取 特 征 点 主 方向 时 ， 考 虑 到 Haar 
小 小 的 模板 人 带宽， 实际 计算 梯度 的 图 像 区 域 是 相同 的 ， 见 图 4-30 所 示 。 

与 SIFT 算法 类 似 ， 使 用 o = 2s 的 高 斯 加 权 函 数 对 Haar 小 波 的 响应 值 进 行 高 斯 加 权 。 为 
了 求 取 主 方 辐 ， 需 要 设计 一 个 以 特征 点 为 中 心 ， 张 角 为 的 局 形 滑动 窗口 。 如 图 4-31 所 


示 ， 以 步 长 0.2 弧度 左右 ， 旋 转 这 个 滑动 窗口 ， 并 对 滑动 窗口 内 图 像 Haar 小 波 响 应 值 de, 
dy 进行 累加 ， 得 到 一 个 矢量 ( m,，09,): 


m,= 9 dx» dy 
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>》 dx 

2 dy 

主 方 问 为 最 大 Haar Hs] v, Z& JH [ELPADG] NS] m, f e I RCPID] INL] Z3 |], BE 
0-0, [max um, | 





0, = arctan 











X Jj EEZ 7 方 同 啊 应 


K| 4-30 Haar 小 波 响 应 模板 图 4-31 求 取 主 方向 时 请 动 窗 口 围绕 特征 点 转动 








可 以 仿照 SIFT 算法 求 主 方向 时 策略 ， 当 存在 另 一 个 相当 于 主峰 值 80% 能 量 的 峰值 时 ， 
则 将 这 个 方向 认为 是 该 特征 点 的 辅 方向 。 一 个 特征 点 可 能 会 被 指定 具有 多 个 方向 (一 个 主 方 
向 ， 一 个 以 上 辅 方向 )， 这 可 以 增强 匹配 的 鲁 棒 性 。 与 SIFT 的 描述 子 类 似 ， 如 果 当 在 m, 中 
出 现 另 一 个 大 于 主峰 能 量 max {mY 80% 时 的 次 峰 ， 可 以 将 该 特征 点 复制 成 两 个 特征 点 。 一 个 
主 方向 为 最 大 响应 能 量 所 对 应 的 方向 ， 另 一 个 的 主 方向 为 次 最 大 响应 能 量 所 对 应 的 方向 。 

生成 特征 点 描述 算 子 与 确定 特征 点 的 方向 有 些 类 似 ， 它 需要 计算 图 像 的 Haar 小 波 响 
应 。 不 过 ， 与 主 方向 的 确定 不 同 的 是 ， 这 次 不 是 使 用 一 个 圆 形 区 域 ， 而 是 在 一 个 矩形 区 域 来 
计算 Haar 小 波 响 应 。 以 特征 点 为 中 心 ， 沿 特征 点 的 主 方向 将 20 X20s 的 图 像 划分 成 4X4 个 
子 块 ， 每 个 子 块 利用 尺寸 28 的 Haar 小 波 模板 进行 响应 值 计算 ， 然 后 对 响应 值 进行 统计 
Yd. Fla Yis Fo ERRER WA 4-32 所 示 。 图 中 ， 以 特征 点 为 中 心 ， 
以 20s 为 边 长 的 矩形 窗口 为 特征 描述 算 子 计算 使 用 的 窗口 ， 特 征 点 到 矩形 边框 的 线段 表示 特 
征 点 的 主 方向 。 

将 20s 的 窗口 划分 成 4X4 子 窗口 ， 每 个 子 窗口 中 有 5sX5s 个 像 元 ， 使 用 尺度 为 2s 的 
Haar 小 波 对 子 窗口 图 像 进行 其 响应 值 计算 ， 共 进行 25 次 采样 ， 分 别 得 到 沿 主 方向 的 dy RUE 




































































直 于 主 方向 的 dx。 然 后 ， 以 特征 点 为 中 心 ， 对 dx. dy 进行 高 斯 加 权 计 算 ， 其 中 o =3.3s 。 
最 后 ， 分 别 对 每 个 子 块 的 响应 值 进 行 统计 ， 得 到 每 个 子 块 的 矢量 
V..47[$ dx, > dd 中 2 dy. dy] 





由 于 共有 4x4 个 子 块 ， 因 此 ， 特 征 描述 算 子 共有 4X4X4=64 维特 征 矢 量 组 成 。SUREF 
描述 子 不 仅 具 有 尺度 和 旋转 不 变性 ， 而 且 对 光照 的 变化 也 具有 不 变性 。 使 用 小 波 响 应 本 身 就 
































其 有 党 度 丰 变性， 而 对 比 度 的 不 变性 则 是 通过 将 特征 矢量 进行 规 一 化 来 实现 的 。 图 4-33 给 
出 了 三 种 不 同 图 像 模式 的 子 块 得 到 的 不 同 结果 。 对 于 实际 图 像 描述 舞 子 ， 可 以 认为 它们 是 由 
这 三 种 不 同 模式 图 像 的 摘 述 子 组 合 而 成 的 。 














图 4-33 不 同 的 图 像 密 上 度 模式 得 到 不 同 的 描述 子 结果 
为 了 充分 利用 积分 图 像 进行 Haar 小 波 的 啊 应 计算 ， 不 直接 通过 旋转 Haar 小 波 模板 求 得 








其 响应 值 ， 而 是 在 积分 和 网 像 上 先 使 用 水 平和 与 直 的 Haar. 小 波 模 板 求 其 响应 值 ， 在 求 得 啊 应 
值 dx 和 dy 后 ， 然 后 根据 主 方向 旋转 dx 和 dy， 使 其 与 主 方向 保持 一 致 。 为 了 求 旋转 后 的 
Haar 小 波 啊 应 值 ， 首 先 要 得 到 旋转 前 图 像 的 位 置 。 旋 转 前 后 图 像 的 位 置 关系 ， 可 以 通过 点 的 
旋转 公式 得 到 : 

X = Xə — j x scale x sin(0) + i x scale x cos(0) 

Y = Y + j x scale x cos(0) + i x scale x sin(0) 

在 得 到 点 (j, 让 在 旋转 前 对 应 积分 图 像 的 位 置 (x,y) Je MARDER EH. Haar 
小 波 求 得 水 平 以 及 垂直 两 个 方向 的 响应 值 dx 和 dy。 对 dx 和 dy 进行 高 斯 加 权 处 理 ， 并 根据 
主 方 癌 的 角度 ， 对 dx 和 dy 进行 旋转 变换 ， 从 而 得 到 旋转 后 的 dx' 和 dy" 。 其 计算 公式 如 下 。 
dx'= w(—dx x sin 0 + dy x cos 8) 
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dy' = w(dx x cos 0 + dy x sin 0) 
图 4-34 说 明 在 有 了 噪声 干扰 下 ，SUREF 特征 描述 子 与 没有 噪声 干扰 时 具有 相同 的 特征 矢量 。 


Y dr 
Y es 
2, dv 
Y Idy 
Y dx 
Y es 
2 dy 
Y ldy 


图 4-34 SURF 特征 描述 算 子 抗 干扰 性 示意 图 





clean 


noisy 








一 般 而 言 ， 特 征 矢量 的 长 度 越 长 ， 特 征 矢量 所 承载 的 信息 量 就 越 大 ， 特 征 描述 子 的 独特 
性 就 越 好 ， 但 匹配 所 付出 的 时 间 代 价 就 越 大 。 对 于 SURF 描述 算 子 ， 可 以 将 它 扩展 到 用 128 
维 矢 量 来 表示 。 具 体 的 方法 是 在 求 >》dx、》 dx| 时 ， 区 分 dy <0 和 dy 0 情况 。 同 样 ， 在 
求 取 》 dy 、>》|d| 时 ， 区 分 dk<0 和 dr>0 人 情况 。 这 样 ， 每 个 子 块 就 产生 了 8 个 梯度 统计 
值 ， 从 而 使 描述 子 特征 矢量 的 长 度 增加 到 8X4X4=128 维 。 

为 了 实现 快速 匹配 ，SUREF 算法 在 特征 矢量 中 增加 了 一 个 新 的 变量 ， 即 特征 点 的 拉 普 
拉 斯 啊 应 正 负 号 。 在 特征 点 检测 时 ， 将 Hessian ERER (Trace) 的 正 负 号 记录 下 来 ， 作 
为 特征 矢量 的 一 个 变量 。 这 样 做 并 不 增加 运算 量 ， 因 为 特征 点 检测 时 已 经 对 Hessian 矩阵 
的 迹 进行 了 计算 。 在 特征 匹配 时 ， 这 个 变量 可 以 有 效 地 节省 搜索 时 间 ， 由 于 只 有 两 个 正 负 
号 相同 的 特征 点 才 可 能 匹配 ， 对 于 不 同 正 负 号 的 特征 点 就 不 再 进行 相似 性 计算 了 。 简 单 地 
说 ， 可 以 根据 特征 点 的 响应 值 符号 ， 将 特征 点 分 成 两 组 ， 一 组 是 具有 拉 普 拉 斯 正 响应 的 特 
征 点 ,一 组 是 具有 拉 普 拉 斯 负 响 应 的 特征 点 。 匹 配 时 ， 只 有 符号 相同 组 中 的 特征 点 才能 i 
行 相互 匹配 。 
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例 程 4-9: 主 函 数 
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function ipts-OpenSurf(img,Options) 

% 输入 

% — I: 输入 图 像 ， 灰 度 岁 像 和 RGB 图 像 部 可 

% Options: 选项 结构 体 

% 

% 输出 

%  Ipts: 输出 为 一 个 结构 体 ， 这 个 结构 体 包含 了 SURF 特征 点 及 其 描述 算 子 的 信息 
% Ipts.x , ipts.y : 位 置 











ctae EIS 





% Ipts.scale : XJ 

% Ipts.laplacian : laplacian 的 邻 域 

% Ipts.orientation : WRABER F HITEL 

% Ipts.descriptor : 特征 问 量 

06 > 
% options, 

%  Options.tresh : Hessian MM B [E (SA 1A [8 0.0002) 

%  Options.octaves : 层 数 (默认 值 为 5) 

%  Options.init sample : 初始 化 采样 补偿 (默认 值 为 2) 


% 将 子 函 数 加 入 MATLAB 的 搜索 路 径 
functionname='OpenSurf.m'; 
functiondir=which(functionname); 
functiondir-functiondir(1:end-length(functionname)); 
addpath([functiondir ";SubFunctions']) 


% 参数 初始 化 
defaultoptions-struct('tresh',0.0002,'octaves',5,init Sample,2, upright,false,extended ,false,verbose ,false); 
if(—-exist('Options','var')), 

Options-defaultoptions; 
else 

tags — fieldnames(defaultoptions); 

for 1-1 :length(tags) 

if(-1isfield(Options,tags(13?)), X Options.(tags [1] )2defaultoptions.(tags (1) ); end 
end 
if(length(tags)--—length(fieldnames(Options))), 
warning('register volumes:unknownoption','unknown options found"); 

end 

end 


% 创建 积分 图 像 


iimg=Integrallmage IntegralImage(1mg); 


% 提取 特征 点 

FastHessianData.thresh = Options.tresh; 
FastHessianData.octaves — Options.octaves; 
FastHessianData.init sample — Options.init sample; 
FastHessianData.img = iimg; 

ipts = FastHessian getIpoints(FastHessianData,Options.verbose); 


% 描述 特征 点 
if(-1sempty(ipts)) 
ipts = | SurfDescriptor DecribeInterestPoints(ipts,Options.upright, Options.extended, iimg, 
Options.verbose); 


end 
KK K K K KK KKK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 
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上 F 述 主 函 数 所 调用 的 子 函数 的 具体 内 容 见 随 书 电子 取材 。 

在 最 新 的 MATLAB 2012 中 ， 可 以 调用 计算 机 视觉 系统 工具 箱 中 (Computer Vision 
System Toolbox) 的 detectSURFFeatures() PK Zi fy JA AZ BE ARI SURF 特征 ， 其 具体 使 
用 方法 如 下 : 





POINTS = detectSURFFeatures(I,Name, Value) 


功能 : 用 于 检测 灰 度 图 像 的 SUREF 特征 。 
输入 : 工 竺 检测 的 灰 度 网 像 。 
Name,Vakue- 'MetricThreshold': 矩阵 阔 值 ， 只 有 大 于 该 网 值 的 才能 人 确定 为 SURF 
特征 点 ， 献 认 值 为 1000。 
-NumOctaves: 组 数 (Octaves)， 默 认 值 为 3。 
-NumScaleLevels: 每 组 的 尺度 层 数 ， 默 认 值 为 4。 
得 出 : POINTS- 返 回 的 一 个 对 象 ， 其 中 包含 看 SURF 特征 点 的 信息 。 
当 获 得 一 幅 图 像 的 SURF 特征 点 的 信息 后 ， 可 以 调用 extractFeaturesO 〇 函数 获取 SURF 特 
iE [8] Œ o 
extractFeaturesO 国 数 的 具体 使 用 方法 如 下 。 


[FEATURES,VALID POINTS] = extractFeatures(I,POINTS) 


功能 : 提取 特征 点 的 特征 问 量 。 

输入 : 工 灰 度 图 像 ; 

输出 : POINTS: 特征 点 信息 。 
FEATURES: 特征 描述 问 量 。 
VALID POINTS: 有效 特征 点 坐标 。 








nm" 
|o ERAS 尺度 不 变 特征 的 应 用 
尺度 不 变 特 征 在 目标 跟踪 和 图 像 拼 接 领 域 有 着 广泛 的 应 用 。 由 于 待 检 测 图 像 与 目标 
t 图 像 之 间 、 待 拼接 图 像 之 间 往 往 存 在 变化 和 干扰 ， 若 采用 尺度 不 变 特征 的 特征 向 量 进 行 
+ 跟踪 匹配 和 拼接 匹配 ， 会 提高 匹配 精度 和 误 检 率 。 但 如 何 提高 尺度 不 变 特 征 检 测 及 匹配 
| 的 实时 性 是 一 个 焉 待 解决 的 问题 ， 
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第 5 章 图 像 识 别 技术 e 


本 章 导 读 

图 像 识 别 技 术 是 数字 图 像 处 理 与 模式 识别 相 结合 的 技术 ， 是 数字 图 像 处 理 领 域 研究 的 热 
点 之 一 。 本 章 介绍 了 基于 不 变 矩 特征 与 神经 网 络 相 结 合 的 图 像 识 别 技术 。 在 学 习 本 章 时 ， 读 
者 应 看 重 了 解 图 像 识别 技术 的 一 般 实现 流程 和 常用 方法 。 


5.1 模式 识别 的 概念 


SEE 什么 是 模式 识 列 


模式 识别 ， 残 是 对 表征 事物 或 现象 的 各 种 形式 的 信息 进行 处 理 和 分 析 ， 是 对 事物 或 现象 
进行 描述 、 辨 认 、 分 类 和 人 解释 的 过 程 ， 是 图 像 处 理 的 重要 组 成 部 分 。 

模 陈 识别 可 以 分 为 有 监督 的 分 类 和 无 监督 的 分 闫 两 种 。 二 者 的 主要 差别 在 于 ， 各 实验 样 
本 所 属 的 闫 别 是 否 预先 已 知 。 一 般 说 来 ， 有 监督 的 分 类 往往 需要 提供 大 量 已 知 关 别 的 样本 。 
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1. 句法 方法 

句法 方法 ， 又 称 结构 方法 或 语言 学 方法 。 其 基本 思 
式 的 组 合 ， 子 模式 叉 可 描述 为 更 简单 的 子 模式 的 组 合 
层 的 最 简单 的 子 模式 称 为 模式 基 元 。 

在 句法 方法 中 ， 通 音 要 求 所 选 的 基 元 能 对 模式 提供 一 个 紧凑 的 反映 其 结构 关系 的 措 述 ， 
又 要 易于 用 非 句法 方法 加 以 抽取 。 选 取 基 元 的 问题 类 似 于 在 统计 方法 中 选取 特征 的 问题 。 显 
然 ， 基 元 本 身 不 应 该 含有 重要 的 结构 信息 。 模 式 以 一 组 基 元 和 和 扬 们 的 组 合 关 系 来 摘 述 ， 称 为 
模式 描述 语句 。 这 与 英文 句子 由 一 些 短 语 、 短 语义 由 单词 、 单 词义 由 字母 构成 一 样 。 基 元 组 
合成 模式 的 规则 ， 由 “文法 ”来 指定 。 识 别 过 程 主要 就 是 进行 句法 分 析 ， 即 分 析 给 定 的 模式 
语句 是 人 奋 符 合 指 定 的 文法 ， 满 足 某 类 文法 的 即 锌 分 入 该 类 。 

2. 统计 方法 

统计 方法 ， 也 称 决 策 理论 方法 ， 是 发 展 较 早 也 比较 成 熟 的 一 种 方法 。 首 先 将 被 识别 对 象 
数字 化 为 适 于 计算 机 处 理 的 数字 信息 。 在 此 过 程 中 ， 一 个 模式 常常 包含 大 量 的 数字 信息 ， 因 
而 常常 震 要 对 这 些 信息 进行 处 理 和 变换 。 许 多 模式 识别 系统 会 先 对 信息 进行 预 处 理 ， 用 于 除 
去 混入 的 干扰 信息 并 减少 某 些 变形 和 和 失真。 随后 是 进行 特征 提取 ， 即 从 数字 化 后 或 预 处 理 后 
的 输入 模式 中 抽取 一 组 特征 ， 这 组 特征 包含 了 所 要 识别 模式 的 关键 信息 ， 并 且 包 含 尽 可 能 少 
的 元 余 信 息 。 特 征 提取 过 程 将 输入 模式 从 对 象 空间 映射 到 特征 空间 。 这 时 ， 模 式 可 用 特征 衬 
间 中 的 一 个 点 或 一 个 特征 癌 量 表示 。 这 种 映射 不 仅 压缩 了 信息 量 ， 而 且 易 于 分 类 。 














是 把 一 个 蛋 式 描述 为 较 简 单 的 子 模 
终 得 到 一 个 树 状 的 结构 描述 ， 在 辰 
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在 统计 方法 中 ， 特 征 提取 占有 十 分 重要 的 地 位 ， 但 没有 通用 的 理论 指导 ， 只 能 通过 分 析 
体 识别 对 象 决定 选取 何 种 特征 。 图 5-1 有 反映 了 统计 方法 的 基本 思路 ， 特 征 提 取 后 可 进行 分 
， 即 从 特征 空间 再 映射 到 决策 空间 。 为 此 需要 引入 决策 函数 ， 由 特征 问 量 计 算出 相应 于 各 
别 的 决策 函数 值 ， 通 过 决 全 函数 值 的 比较 实行 分 类 。 
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图 5-1 统计 方法 的 基本 思路 


模式 识别 方法 的 选择 取决 于 问题 的 性 质 。 如 末 被 识别 的 对 象 极 为 复 杀 ， 而 且 包 含 丰 吝 的 
结构 信息 ， 一 般 采 用 人 句法 方法 ， 如 果 个 识别 对 象 不 很 复 森 、 不 含 明显 的 结构 信息 或 结构 模型 
不 易 建 立 ， 一 般 采 用 统计 方法 。 这 两 种 方法 不 能 截然 分 开 ， 在 句法 方法 的 某 些 应 用 中 ， 基 元 
本 身 就 是 用 统计 方法 抽取 的 。 将 这 两 种 方法 结合 起 来 分 别 应 用 于 不 同 的 层次 ， 御 能 收 到 较 好 
RC e 

除了 上 述 的 句法 方法 和 统计 方法 这 两 种 传统 方法 外 ， 模 糊 识 列 方法 和 神经 网 络 方法 也 被 
引入 到 模式 识别 当中 ， 并 日 益 受 到 研究 者 们 的 重视 ， 将 在 后 文 介绍 。 


SINE 模式 识别 的 应 用 


模式 识别 的 应 用 领域 十 分 广泛 ， 常 见 应 用 包括 : 文学 识别 、 语 首 识 别 、 图 像 目 标识 别 、 
遥感 和 医学 诊断 等 。 

d) 文学 识别 

汉字 输入 主要 可 分 为 人 工 键 盘 输 入 和 机 器 目 动 识别 输入 两 种 。 其 中 ， 人 工 键 盘 输 入 速度 
慢 而 且 筋 动 强 上 度 大 ， 目 动 识别 输入 速度 快 、 效 率 高 ， 能 够 有 效 减 轻 人 工 的 邦 动 强度 。 从 目 动 
识别 技术 的 难度 来 说 ， 手 写 体 识别 的 难度 高 于 印刷 体 识 别 。 上 有 目前， 印刷 体 光 学 学 符 识 别 技术 
的 准确 率 和 识别 速度 已 经 能 够 满足 大 多 数 用 户 需 求 ， 而 随 看 移动 通信 技术 的 不 断 发 展 ， 手 写 
体 识 别 也 已 能 满足 应 用 要 求 。 

(20 语音 识别 

语 首 识别 技术 所 涉及 的 领域 除了 模式 识别 外 ， 还 包括 信号 处 理 、 概 率 论 和 人 信息论、 发声 
机 理 和 听觉 机 理 以 及 人 工 智 能 等 。 近 年 来 ， 在 生物 识别 技术 领域 中 ， 声 纹 识 别 技术 以 其 独特 
的 方便 性 、 经 济 性 和 准确 性 等 优势 受到 世人 瞩目 ， 并 日 瘟 成 为 人 们 日 钊 生活 和 工作 中 重要 且 
普及 的 安 验证 方式 。 利 用 隐 式 马尔 柯 夫 模型 的 语音 识别 方法 现 已 成 为 语音 识别 的 主流 技术 ， 
该 方法 在 语音 识别 时 识别 速度 较 快 ， 也 有 较 高 的 识别 率 。 

G) 图 像 目标 识别 

图 像 目标 识别 是 指 将 一 类 特殊 目标 从 其 他 类 型 的 目标 中 被 区 分 出 来 的 过 程 。 它 既 包 括 两 
个 非常 相似 目标 的 识别 ， 也 包括 一 种 类 型 的 目标 同 其 他 类 型 目标 的 识别 。 图 像 目 标识 别 技术 
正 以 飞快 的 增长 速度 越 来 越 多 地 应 用 于 国民 经 济 、 空 间 技 术 和 国防 等 领域 。 

国内 对 图 像 目 标识 别 应 用 最 为 广泛 的 领域 之 一 是 车 牌 识别 ， 利 用 安装 于 公路 上 的 摄像 机 
采集 机 动车 图 像 ， 并 识别 车 牌号 码 。 上 此外， 一些 大 学 的 实验 室 中 还 有 通过 图 像 识 别 乒 乓 球 位 
置 探 制 机 器 人 打球 的 应 用 实例 。 在 国防 领域 ， 岁 像 目 标识 别 技术 也 开始 应 用 于 某 些 重要 军事 
目标 的 识别 ， 有 效 提 高 了 军事 打击 的 准确 性 和 打击 效果 。 
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(4) 遥感 图 像 
遥感 图 像 是 指 记录 各 种 地 物 电 磁 波 大 小 的 相片 ， 在 遥感 中 主要 是 指 航空 相片 和 卫星 相 
片 。 遥 感 图 像 识别 已 广泛 用 于 农作物 估 产 、 资 源 勘察 、 气 象 预 报 和 军事 侦察 等 。 
(5) 医学 诊断 e 
医学 诊断 方面 ， 在 癌 细 胞 检测 、X 射线 照片 分 析 、 血 液化 验 、 血 管 造 影 、 染 色 体 分 析 、 
心电图 诊断 和 脑 电 图 诊断 等 方面 ， 模 式 识别 已 取得 了 成 效 。 


5.2. 基于 图 像 的 模式 识别 方法 


图 像 模式 识别 的 方法 很 多 ， 但 是 每 种 方法 部 需要 依据 图 像 的 茶 些 特征 来 进行 识别 。 从 图 
像 的 视觉 特征 来 看 ， 图 像 特征 主要 可 分 为 磊 色 特征 、 形 状 特征 、 纹 理 特征 和 空间 层次 关系 特 
征 。 其 中 ， 基 于 颜色 特征 的 识别 技术 主要 针对 彩色 图 像 ， 通 过 凑 色 直方 图 具有 的 简单 且 随 图 
像 的 大 小 、 旋 转变 换 不 敏感 等 特点 进行 分 关 识 别 。 基 于 形状 特征 的 识别 方法 ， 其 关键 是 找到 
图 像 中 目标 的 形状 并 对 此 进行 描述 ， 以 完成 不 同 网 像 的 分 类 ， 往 往 需要 对 目标 的 边缘 轮廓 、 
形状 、 重 心 等 参数 进行 提取 。 基 于 纹理 特征 的 识别 方法 是 通过 对 图 像 中 非常 具有 结构 规律 的 
特征 加 以 分 析 或 者 是 对 图 像 中 色彩 强度 的 分 布 信息 进行 统计 来 完成 。 基 于 空间 层次 的 识 列 方 
法 则 需要 根据 立体 目标 各 部 分 的 层次 关系 判断 出 其 在 图 像 中 的 方 辐 和 位 置 。 

根据 模式 特征 选择 及 判别 决策 方法 的 不 同 ， 可 将 图 像 模式 识别 方法 大 人 笃 归 纳 为 两 类 :名 
法 模式 识别 方法 和 统计 模式 识别 方法 。 此 外 ， 近 些 年 随 看 对 模式 识别 技术 研究 的 进一步 深 
和 入， 模糊 模式 识别 方法 和 神经 网 络 模式 识别 方法 也 开始 得 到 广泛 的 应 用 。 在 此 将 这 四 种 方法 
进行 一 下 简单 介绍 。 
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法 的 问题 ， 同 时 还 要 考虑 特征 提取 过 程 中 巨大 的 计算 量 。 因 此 对 于 这 种 较为 复杂 的 模式 ， 研 
完 者 们 就 想到 这 样 的 一 种 设计 ， 即 把 一 个 模 却 摘 述 为 较 简 单 的 和子 模式 的 组 合 ， 子 模式 叉 可 描 
述 为 更 简单 的 子 模 陈 的 组 合 ， 最 终 得 到 一 个 树 状 的 结构 描述 ， 在 撒 层 的 最 简单 的 子 模式 称 为 
模式 基 元 。 识 别 过程 束 可 转化 为 : 通过 对 基 元 的 识别 ， 进 而 识别 子 模 式 ， 最 终 识别 该 复杂 模 
式 。 正 如 瑞 文 句子 由 一 些 短 语 ， 短 语 又 由 单词 ， 单 词义 由 字母 构成 一 样 。 用 一 组 模式 基 元 和 
它们 的 组 成 来 撕 述 模式 结构 的 语言 ， 称 为 模式 描述 语言 。 文 配 基 元 组 成 模式 的 规则 称 为 文 
法 。 当 每 个 基 元 被 识别 后 ， 利 用 句法 分 析 束 可 以 做 出 整个 的 模 陈 识别 。 即 以 这 个 句子 是 否 符 
合 某 特定 文法 ， 来 判别 它 是 否 属于 茶 一 类 别 。 这 束 是 句法 模式 识别 的 基本 思想 。 

句法 模式 识别 系统 主要 由 预 处 理 、 基 元 提取 、 人 句 法 分 析 和 文法 推断 每 几 部 分 组 成 。 由 
预 处 理 分 割 的 模式 ， 经 基 元 提取 形成 描述 模式 的 有 序 基 元 串 。 句 法 分 析 根 据 文 法 推理 所 推 
晰 的 文法 ， 判 决 有 订 基 元 是 所 描述 的 模式 类 别 ， 得 到 判决 结 末 。 不 同 的 模式 类 对 应 痢 不 同 
的 文法 ， 描 述 不 同 的 目标 。 为 了 得 到 与 模 却 关 相 适应 的 文法 ， 类 似 于 统计 模式 识别 的 训练 
过 程 ， 人 句法 模式 识别 也 必须 事先 采集 足够 多 的 训练 模式 样本 ， 经 基 元 提取 后 把 相应 的 文法 
推断 出 来 。 
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RRA 统计 模式 识别 


统计 模式 识别 是 目前 最 成 熟 也 是 应 用 最 广泛 的 方法 。 统 计 决 策 理 论 的 基本 思想 是 在 不 同 
的 模式 类 中 建立 一 个 决策 边界 ， 利 用 决策 函数 把 一 个 给 定 的 模式 归 入 相应 的 模式 类 中 。 统 计 
模式 识别 的 基本 模型 如 图 5-2， 该 模型 主要 包括 两 种 操作 模型 :训练 和 分 类 。 其 中 ， 训 练 主 
要 通过 对 已 有 样本 的 大 量 统计 分 析 ， 完 成 对 决策 边界 的 划分 ， 并 应 采取 一 定 的 学 习 机 制 以 你 
证 基于 样本 的 划分 是 最 优 的 ， 而 分 类 主要 对 输入 的 模式 利用 其 特征 和 训练 得 来 的 决策 函数 而 
把 模式 划分 到 相应 模式 类 中 。 

















分 类 


训练 特征 提取 / . 
训练 数据 一 预 处 理 -一 ug cm 学 习 


于 | 





图 5-2 统计 模式 识别 模型 


使 用 统计 方法 进行 图 像 的 模式 识别 时 ， 特 征 提 取 占 有 十 分 重要 的 地 位 ， 因 为 训练 和 分 
类 的 对 象 往往 不 是 图 像 本 身 ， 而 是 通过 特征 提取 之 后 的 数据 ， 即 将 对 象 空间 的 数据 通过 特 
征 提 取 英 射 到 特征 衬 间 。 但 提取 的 方法 并 没有 通用 的 理论 指导 ， 只 能 通过 分 析 有 具体 识别 对 
象 决定 选取 何 种 特征 。 特 征 提取 后 可 进行 分 类 ， 即 从 特征 空间 再 映射 到 决策 空间 。 为 此 需 
要 引入 鉴别 疯 数 ， 由 特征 问 量 计算 出 相应 于 各 类 别 的 鉴别 函数 值 ， 通 过 鉴别 函数 值 的 比较 
实行 分 类 。 

统计 模式 识别 根据 采用 方法 的 不 同 可 以 进行 多 种 形式 的 分 类 : 对 条 件 密度 已 知 的 样本 ， 
可 通过 贝 叶 斯 决策 理论 进行 分 类 ; 对 于 条 件 密度 未 知 的 情况 ， 可 根据 训练 样本 的 类 别 是 否 已 
知 将 分 类 问题 分 为 有 监督 学 习 和 无 监督 学 习 两 大 类 。 其 中 ， 有 监督 学 习 和 无 监督 学 习 义 可 根 
据 是 否 通 过 参数 决 全 分 为 参数 估计 和 非 参 数 估 计 。 

统计 模式 识别 的 男 一 种 分 类 方法 是 根据 决策 边界 是 否 直 接 得 到 而 将 其 分 为 几何 分 类 法 和 
概率 分 类 法 。 几 何 分 类 经 党 直接 从 优化 一 定 的 代价 函数 构造 决策 边界 ; 而 概 深 分 类 法 则 基于 
概率 密度 ， 需 要 前 先 估计 密度 疯 数 ， 然 后 构造 分 类 函数 指定 决策 边界 。 

下 和 面 简单 介绍 儿 种 统计 模式 识别 的 方法 。 

1. 几何 分 类 法 

儿 何 分 类 法 中 ， 以 模式 存在 的 几何 可 分 的 特性 作为 分 类 依据 ， 通 过 给 定 的 判别 函数 进行 
J 

(1) 模板 思 配 法 

它 是 模式 识别 中 的 一 个 最 原始 、 最 基本 的 方法 ， 它 将 竺 识 模式 分 别 与 各 标准 模板 进行 四 
配 ， 通 过 一 个 相关 度 函 数 计算 竺 识 模式 的 各 个 区 域 与 各 标准 模板 之 间 的 相关 上 度 ， 每 个 位 置 都 
对 应 一 个 相关 上 度 值 ， 该 值 越 高 ， 则 匹配 情况 越 好 ， 最 后 取 匹 配 最 好 的 作为 识别 结果 。 需 要 说 
明 的 是 ， 模 板 史 配对 于 像素 十 分 敏感 ， 目 标的 畸变 、 大 小 变化 、 角 上 度 变 化 都 可 能 对 结果 产生 
较 大 影响 。 
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(2) 距离 分 类 法 
距离 是 一 种 重要 的 相似 性 度量 ， 通 常 认为 空间 中 两 点 距离 越 近 ， 表 示 实 际 上 两 样本 越 相 
似 。 大 约 有 十 余 种 作为 相似 性 度量 的 距离 函数 ， 其 中 使 用 最 广泛 的 是 欧 氏 距离 。 它 是 使 用 最 
为 广泛 的 方法 之 一 ， 常 用 的 有 平均 样本 法 、 平 均 距 离 法 、 最 近邻 法 和 -近邻 法 。 > 
(3) 线性 判别 函数 
和 上 述 的 方法 不 同 ， 判 决 函数 法 是 以 判决 边界 的 函数 形式 的 假定 为 其 特性 的 ， 而 上 述 
的 方法 都 是 以 所 考虑 的 分 布 的 假定 为 其 特性 的 。 假 如 一 个 线性 判决 边界 取 成 如 式 (5-1) 的 
形式 




















g(x) =w, xX * wx, o wx, (5-1) 


aW -D 是 合适 的 话 ， 那 么 下 一 步 束 是 要 确定 它 的 权 系 数 。 权 系数 可 通过 感知 器 
算法 或 最 小 平方 误 兰 算法 来 实现 。 但 作为 一 条 规则 ， 应 用 此 方法 必须 注意 两 点 : 第 一 是 方法 
HN uid, US AENEA ER UR IRI VR ZEE WU 

(4) 非 线 性 判别 函数 

线性 判决 函数 的 特点 是 简单 多 行 ， 但 实际 应 用 中 许多 问题 实际 是 非 线 性 的 ， 对 此 ， 有 
两 种 处 理 方式 : 一 种 方法 是 将 非 线 性 函数 转换 为 线性 判决 函数 ， 又 称 为 广义 线性 判决 函 
数 ; 男 一 种 方法 借助 场 的 概念 ， 引 入 非 线 性 的 势 函 数 ， 它 经 过 训练 后 即 可 用 来 解决 模式 的 
分 类 问题 。 

2. 概率 分 类 法 

几何 分 类 法 是 以 模式 类 几何 可 分 为 前 提 条 件 的 ， 但 是 模式 的 分 布 常 沼 不 是 几何 可 分 的 ， 
即 在 同一 区 域 中 可 能 出 现 不 同 的 模式 。 这 时 ， 必 须 借助 概率 统计 这 一 数学 工具 。 可 以 说 ， 概 
深 分 类 法 的 基石 是 贝 叶 斯 决 宋 理 论 。 

设 有 R 类 样本 ， 分 别 为 wo ws s wo GRRE Pwi) i — 1,2,3,…,R， 
对 于 一 随机 矢量 X， 每 类 的 条 件 概 率 〈 又 称 类 概率 密度 ) 为 POYWTWi;)， 则 根据 贝 叶 斯 公式 ， 
后 验 概 率 如 式 “5-2) 所 示 : 












































pon, 1) - POCO On) "T 


2,p(X |w; )pQs) 


MERRER, A UTERIS UU: 

fi j-arg max|p(w|X)]. Wl X Ewi, Hh ijLbL2,.,R, HVviszi 

CI) APR UlnEA S38 CNBC) 

朴素 贝 叶 斯 分 类 是 一 种 十 分 简单 的 分 类 算法 ， 其 基本 思想 为 : 对 于 给 出 的 竺 分 类 项 ， 求 
解 在 此 项 出 现 的 条 件 下 各 个 闫 别 出 现 的 概 雍 ， 哪 个 最 大 ， 束 认为 此 竺 分 类 项 属于 哪个 类 别 ， 
如 我 们 看 到 一 个 黑人 ， 一 般 会 猜测 他 来 目 非 洲 ， 因 为 黑人 中 来 日 非洲 的 比例 最 高 。 在 没有 其 
他 可 用 信息 下 ， 选 择 条 件 概 率 最 大 的 类 别 ， 这 就 是 杆 素 贝 叶 斯 的 基本 思想 。 

朴素 贝 叶 斯 分 类 的 工作 过 程 如 下 。 

1) 每 个 数据 样本 用 一 个 n 维特 征 辣 量 X=. An RR, pda n 个 属性 
41,42,…,An FEAT] n A ES. 

2) 假定 有 m 个 类 C1,C…,Cn。 给 定 一 个 未 知 的 数据 样本 X CHE 2S b S0, 4 ESI 
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将 预测 x 属于 具有 最 高 后 验 概 率 〈 条 件 X PO 的 类 。 即 朴素 贝 叶 斯 分 类 将 未 知 的 样本 分 配 
给 类 Co WMA (5-3) 所 示 。 
P(C,/X)> P(C,/X),1<j<m,j=+i (5-3) 
这 样 ， 最 大 化 P(C/X). E P(Cj/ 加 最 大 的 类 C; 称 为 最 大 后 验 假定 。 根 据 贝 叶 斯 定理 ， 有 
式 (5-4) 和 式 (5-5) 








P(X/H)P(H) 


PULLX) - — ges (5-4) 
pc, 3n = LP) es 








3) 由 于 POCO 对 于 所 有 类 为 常数 ， 只 需要 P(X/C) P(C) 最 大 即 可 。 如 果 类 的 先 验 概 率 未 
知 ， 则 通常 假定 这 些 类 是 等 概率 的 ， 即 PCCD)=P(C?)=…=P(C)， 并 据 此 只 对 PCX/O) 最 大 化 。 
否则 ， 最 大 化 P(X/C) P(C)。 注 意 ， 类 的 先 验 概 率 可 以 用 P(C)=s /s 计算， 其 中 s CP 
的 训练 样本 数 ， 而 是 训练 样本 总 数 。 

4) 给 定 具 有 许多 属性 的 数据 集 ， 计 算 PCX/C) 的 开销 可 能 非常 大 。 为 降低 计算 P(X /C) 
的 开销 ， 可 以 做 类 条 件 独立 的 朴素 假定 。 给 定 样本 的 类 标号 ， 假 定 属性 值 相互 条 件 独 记 ， 即 
在 属性 间 ， 不 存在 依赖 关系 。 这 样 

















P(X 16) - | [ PG, /€) (5-6) 
k=l 


概率 P(X /C), PQOG/C). +, P(X, /OD) 可 以 由 训练 样本 估 值 ， 其 中 : 

O 如果 A262 2S STE, W pC /CD)= sa Iso HP sx 是 在 属性 A, ERR TR x 92S C; 的 
样本 数 ， 而 s; E Ci; 中 的 训练 样本 数 。 

D WR 水 是 连续 值 属性 ， 则 通 第 假定 该 属性 服从 高 斯 分 布 ， 因 而 

P(X./CA- B ] =) 
(X, PRONUM 206 

其 中 ， 给 定 类 C 的 训练 样本 属性 ARE gO Hee) ÆRE 4i 的 高 斯 密度 函数 ， 而 
Hc ,Oc 分 别 为 平均 值 和 标准 声 。 

5) 为 对 未 知 样本 X 分 类 ， 对 每 个 类 Co WE P(X/Cj) P(C) IER X HIREK Co 25 
且 仅 当 














(5-7) 











P(X/G)P(C)» P(X/C))PF(C,)1« j&mjsi (5-8) 


MAZ, XPE EJH PX /C) P(OC) 最 大 的 类 Cio 

整个 朴素 贝 叶 斯 分 类 分 为 如 下 三 个 阶段 。 

第 一 阶段 一 一 准备 工作 阶段 。 这 个 阶段 的 任务 是 为 朴素 贝 叶 斯 分 类 做 必要 的 准备 ， 主 要 
工作 是 根据 具体 情况 确定 特征 属性 ， 并 对 每 个 特征 属性 进行 适当 划分 ， 然 后 对 一 部 分 竺 分 类 项 
进行 人 工分 类 ， 形 成 训练 样本 集合 。 这 一 阶段 的 输入 是 所 有 竺 分 类 数据 ， 输 出 是 特征 属性 和 训 
练 样本 。 这 一 阶段 是 整个 朴素 贝 叶 斯 分 类 中 唯一 需要 人 工 完 成 的 阶段 ， 其 质量 对 整个 过 程 将 有 
重要 影响 ， 分 类 器 的 质量 很 大 程度 上 由 特征 属性 、 特 征 属性 划分 及 训练 样本 质量 决定 。 
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第 二 阶段 分 类 器 训练 阶段 ， 这 个 阶段 的 任务 就 是 生成 分 类 器 ， 主 要 工作 是 计算 每 个 
类 别 在 训练 样本 中 的 出 现 频率 及 每 个 特征 属性 划分 对 每 个 类 别 的 条 件 概率 估计 ， 并 记录 结 
果 。 其 输入 是 特征 属性 和 训练 样本 ， 输 出 是 分 类 器 。 这 一 阶段 是 机 械 性 阶段 ， 根 据 前 面 讨论 
的 公式 可 以 由 程序 自动 计算 完成 。 > 

第 三 阶段 应 用 阶段 。 这 个 阶段 的 任务 是 使 用 分 类 器 对 待 分 类 项 进行 分 类 ， 其 输入 是 
分 类 器 和 待 分 类 项 ， 输 出 是 待 分 类 项 与 类 别 的 映射 关系 。 这 一 阶段 也 是 机 械 性 阶段 ， 由 程序 
完成 。 

(2) 半 朴 素 贝 叶 斯 分 类 模型 (SNBC ) 

为 了 进一步 提高 分 类 性 能 ， 有 人 提出 了 半 朴 素 贝 叶 斯 分 类 的 构想 。 半 朴素 贝 叶 斯 分 类 模 
型 对 朴素 贝 叶 斯 分 类 模型 的 结构 进行 了 扩展 ， 其 目的 是 为 了 突破 朴素 贝 叶 斯 分 类 模型 特征 属 
性 间 独 立 性 假设 限制 。 目 前 ， 半 朴素 贝 叶 斯 分 类 模型 学 习 的 关键 是 如 何 有 效 组 合 特征 属性 。 
半 朴 素 贝 叶 斯 分 类 学 习 算 法 可 以 解决 目前 一 些 学 习 算法 中 存在 的 效率 不 高 及 部 分 组 合意 义 不 
大 的 问题 。SNBC 的 结构 比 NBC GE, E SNBC 的 模型 构建 过 程 中 ， 依 照 一 定 的 标准 将 关 
联 程度 较 大 的 基本 属性 ( 即 NBC 中 的 特征 属性 ) 合并 在 一 起 构成 “组 合 属性 ”( 也 称 之 为 
“大 属性 ”)， 因 而 如 何 有 效 组 合 特征 属性 是 SNBC 学 习 的 关键 。 罗 辑 上 ，SNBC 中 的 组 合 属 
性 与 NBC 中 的 基本 属性 没有 根本 性 差别 ，SNBC 的 各 个 组 合 属性 之 间 也 是 相对 于 类 别 属性 
相互 独立 的 。 图 $-3 是 SNBC 的 模型 示意 图 。 
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这 类 模型 通过 将 依赖 性 强 的 基本 属性 结合 在 一 起 构建 新 的 模型 ， 这 样 可 以 部 分 屏蔽 
NBC 中 独立 性 假设 对 分 类 的 负面 作用 。 但 从 名 称 可 以 看 出 ，SNBC 依然 属于 朴素 贝 叶 斯 分 类 
的 范畴 。 这 是 因为 除了 结构 上 的 兰 别 之 外 ， 计 算 推 导 过 程 与 NBC 无 异 。 


5.2.3 模糊 模式 识别 


模糊 模式 识别 的 理论 基础 是 20 世纪 60 年 代 诞生 的 模糊 数学 ， 它 根据 人 对 事物 识别 的 思 
维 迎 辑 ， 结 合 人 类 大 脑 识别 事物 的 特点 ， 将 计算 机 中 常用 的 三 值 迎 务 转 向 连续 地 辑 。 在 图 像 
识别 领域 应 用 时 该 方法 可 以 简化 图 像 识 别 系统 ， 并 具有 实用 、 可 靠 等 特 氮 。 

模糊 模式 识别 中 比较 成 熟 的 理论 和 方法 有 最 大 隶属 原则 、 基 于 模糊 等 价 天 系 的 模式 
分 类 、 基 于 模糊 相似 关系 的 模式 分 类 和 模糊 聚 类 ， 其 中 模糊 肾 类 方法 的 研究 尤为 成 功 、 
且 应 用 广泛 ， 己 广泛 应 用 于 图 形 识别 、 染 色 体 和 日 血球 识别 、 图 像 目标 的 形状 分 析 、 手 
写 体 文子 识别 等 。 但 其 中 也 直到 不 少 困 难 ， 其 中 一 个 典型 的 例子 就 是 隶属 函数 的 确定 往 
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往 带 有 经 验 色 彩 。 
应 用 模糊 方法 进行 图 像 识别 的 关键 是 确定 东 一 类 别 的 隶属 函数 ， 而 各 类 的 统计 指标 则 要 
由 样本 像 元 的 灰 度 值 和 样本 像 元 的 隶属 函数 的 值 即 隶 属 度 共同 决定 。 


5.2.4 侧 经 网 络 模式 识别 


神经 网 络 的 研究 始 于 20 世纪 40 年 代 ，20 世纪 80 年 代 开始 在 各 国 广泛 兴起 。 神 经 网 络 
模式 识别 源 于 对 动物 神经 系统 的 研究 ， 通 过 采用 使 件 或 软件 的 方法 ， 建 立 了 许多 以 大 量 处 理 
单元 为 结 点 ， 各 单元 通过 一 定 的 模式 实现 互联 的 拓扑 网 络 。 访 网络 通过 一 定 的 机 制 ， 能 够 模 
仿生 物 的 神经 系统 的 结构 和 功能 。 

神经 网 络 是 一 种 全 新 的 模式 识 列 拉 术 ， 它 具有 以 下 儿 个 方面 的 特点: 神经 网 络 具 有 分 布 
式 存储 信息 的 特点 ; 神经 元 能 够 独立 运算 和 处 理 收 到 的 信息 ， 即 系统 能 够 并 行 处 理 输入 的 信 
Es 具有 日 组 织 、 目 学 习 的 能 力 。 


5.3 ”基于 图 像 模式 识别 的 过 程 


基于 图 像 模 式 识别 的 一 般 过 程 通 第 包含 图 像 及 集 、 图 像 存储 、 图 像 预 处 理 、 图 像 变 换 、 












































特征 提取 、 目 标识 别 等 过 程 ， 如 图 5-4 所 示 。 


图 像 存储 aem agen Ò MEE YX 目标 识别 





图 5-4 图 像 模式 识别 的 一 般 过 程 


(1) 图 像 采 集 

在 图 像 采 集 阶 段 ， 所 要 识别 的 图 像 通 过 网 像 采 集 系 统 采集 进来 。 网 像 采 集 系统 主要 由 镜 
头 、 图 像 传感器 、 图 像 采 集 卡 组 成 。 

一 般 情 况 下 ， 除 了 通过 扫 摘 仪 或 其 他 特殊 图 像 采 集 设备 进行 图 像 采 集 时 ， 图 像 采 集 系 统 
大 都 配 有 镜头 。 镜 头 又 分 为 定 焦 镜 头 和 变焦 镜头 ， 其 中 对 于 图 像 处理 比 较 重 要 的 参数 包括 景 
深 、 视 场 角 、 焦 距 以 及 光圈 。 这 部 分 内 容 涉 及 的 知识 点 较 多 ， 本 书 不 展开 讲解 ， 读 者 可 以 日 
行 查阅 相关 理论 。 

常见 的 图 像 传 感 器 一 般 有 CCD 和 CMOS 两 种 。CCD 又 称 电荷 耦合 元 件 ， 是 一 种 半 导 
体 器 件 ， 它 上 面 许多 的 感光 单元 能 够 把 光学 影像 转化 为 数字 信号 ， 而 每 一 个 感光 单元 被 称 作 
像素 。CCD 以 其 优异 的 成 像 质量 和 啊 应 速度 成 为 目前 应 用 最 为 广泛 的 图 像 传感器 之 一 。 
CMOS 又 称 互补 金属 氧化 物 半 导体 ， 其 工作 原理 与 CCD 类 似 ， 主 要 区 别 在 于 材料 。CMOS 
的 成 像 质量 普 壳 较 CCD 差 ， 但 其 也 有 功 耗 低 、 价 格 低 的 优点 。 不 过 ， 随 着 技术 的 进步 ， 
CCD 和 CMOS 的 差异 正在 缩小 。 

图 像 采 集 卡 用 于 将 摄像 头 采 集 到 的 模拟 图 像 信 号 转化 为 计算 机 能 够 识别 的 信号 并 输入 计 
算 机 中 ， 和 党 用 于 中 低 端 安防 监控 领域 。 高 端 或 者 定制 的 图 像 采 集 系统 中 ， 系 统 自 带 图 像 压 缩 
芯片 ， 直 接 输 出 数字 图 像 信号 ， 这 时 就 不 再 需要 单独 的 图 像 采 集 卡 。 

(2) 图 像 存 储 

图 像 在 被 采集 之 后 ， 束 需要 进行 存储 。 图 像 存储 涉及 两 个 要 素 : 文件 格式 和 存储 体系 。 
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图 像 文件 格式 多 种 多 样 ， 但 不 同 场合 使 用 的 图 像 格式 却 不 完全 一 样 。 互 联网 中 一 般 使 用 
GIF, JPG, PNG 类 格式 的 图 像 ， 而 印刷 中 用 的 比较 多 的 是 TIF、JPG、TAG、PCX 格式 ， 符 
合 国际 标准 的 图 像 格 式 为 TIF 和 JPG。 不 过 目前 能 够 进行 图 像 格式 转化 的 方法 有 很 多 ， 图 像 
格式 对 于 图 像 处 理 来 说 已 不 是 制约 效果 的 关键 因素 。 > 

图 像 识别 系统 的 搭建 过 程 中 ， 需 要 考虑 图 像 存储 的 硬件 体系 ， 依 据 图 像 处 理 要 求 的 不 同 
会 有 不 同 的 存储 方案 。 有 基体 的 存储 体系 可 分 为 内 存 存 储 、 便 盘 人 存储、 备份 存 储 、 分 级 存储 和 
网 络 存储 。 其 中 ， 应 用 最 广泛 的 当 属 内 存 存储 、 便 盘存 储 和 备份 存储 。 内 存 存储 主要 应 用 于 
图 像 处 理 ， 便 稚 存 储 主要 用 于 图 像 处 理 和 在 线 备 份 ; 备份 存储 除了 在 线 备份 外 ， 还 包括 近 线 
存储 和 离线 存储 ， 可 以 使 用 光盘 等 存储 介质 。 

(3) 图 像 预 处 理 

为 了 获得 更 适合 处 理 和 识别 的 图 像 ， 需 要 先 将 图 像 数据 根据 所 要 应 用 的 识别 方法 进行 优 
化 ， 即 进行 图 像 预 处 理 。 图 像 预 处 理 的 方法 很 多 ， 包 括 空间 域 的 方法 和 频率 域 的 方法 ， 主 要 
目的 有 两 个 : 一 是 改善 图 像 的 视觉 效果 ， 提 高 图 像 的 清晰 度 ， 二 是 将 图 像 转换 成 一 种 更 适合 
于 人 类 或 机 器 进行 分 析 处 理 的 形式 ， 以 便 从 图 像 中 获取 更 多 有 用 的 信息 。 常 用 的 方法 为 直方 
图 增强 和 图 像 平滑 等 。 

直方 图 能 够 反映 数字 图 像 的 概貌 性 描述 ， 例 如 图 像 的 灰 度 范围 、 灰 度 的 分 布 、 整 幅 图 像 
的 平均 亮度 和 明 虹 对比度 等 ， 并 可 以 由 此 得 出 进一步 处 理 的 重要 依据 。 但 是 同时 ， 直 方 图 与 
图 像 之 则 并 非 一 一 对 应 关系， 它 不 能 完整 地 描述 一 幅 图 像 。 对 直方 图 进行 修正 往往 可 以 增 大 
反 震 ， 使 图 像 细 贡 清 晰 ， 达 到 图 像 增强 的 目的 。 第 用 方法 有 下 方 图 均衡 化 和 下 方 图 规定 化 。 

图 像 平 滑 主要 用 于 消除 图 像 中 的 噪声 ， 也 即 消 除 各 类 外 界 和 干扰。 平滑 噪声 又 分 为 在 空间 
域 中 进行 或 在 频率 域 中 进行 两 类 。 空 间 域 平滑 的 基本 方法 是 求 像 素 灰 度 的 平均 值 或 中 值 ， 常 
见方 法 有 多 图 像 平 均 法 、 邻 域 平 均 法 、 中 值 滤波 等 。 每 种 方法 各 有 特点 : 多 图 像 平 均 法 需要 
c AER, KAW: 邻 域 平均 法 在 平滑 噪声 的 同时 ， 却 使 图 像 变 模糊 ， 降 低 了 图 像 质 量 ; 
中 值 滤波 能 够 在 较 好 保持 图 像 原 貌 的 同时 滤 除 噪点 ， 是 一 种 较为 理想 的 去 噪 方法 。 为 了 既 平 
滑 噪声 又 保护 图 像 信 号 ， 也 有 一 些 改进 的 技术 ， 比 如 在 频 域 中 运用 低 通 滤波 技术 。 

(4) 图 像 变换 

图 像 变 换 是 为 了 达到 某 种 目的 ， 而 将 原始 图 像 变换 映射 到 另 一 个 空间 上 ， 使 得 图 像 的 某 
些 特征 得 以 突出 ， 以 便于 后 续 处 理 和 识别 的 变换 。 一 般 变 换 后 的 图 像 ， 大 部 分 能 量 都 分 布 于 
低频 谱 段 ， 这 对 以 后 图 像 的 压缩 、 传 输 都 比较 有 利 。 

常用 的 图 像 变 换 方法 有 空间 变换 、 傅 里 叶 变 换 、 人 余弦 变 换 、 小 波 变 换 、Walsh-Hadamard 
变换 、Hough 变换 和 K-L 变换 等 ， 更 多 更 深入 的 内 容 参见 第 二 章 。 

(5) 特征 提取 

图 像 的 特征 有 很 多 ， 从 视觉 特征 来 看 可 以 归纳 为 颜色 特征 、 形 状 特征 、 纹 理 特 征 和 空间 
层次 关系 特征 四 类 。 

其 中 ， 基 于 颜色 特征 的 识别 技术 主要 针对 彩色 图 像 ， 通 过 颜色 直方 图 具有 的 简单 且 对 于 
图 像 的 大 小 、 旋 转变 换 不 敏感 等 特点 进行 分 类 识别 。 基 于 形状 特征 的 识别 方法 ， 其 关键 是 找 
到 图 像 中 目标 的 形状 并 对 此 进行 描述 ， 以 完成 不 同 图 像 的 分 类 ， 人 往往 需要 对 目标 的 边缘 轮 
廊 、 形 状 、 重 心 等 参数 进行 提取 。 基 于 纹理 特征 的 识别 方法 是 通过 对 图 像 中 具有 结构 规律 的 
特征 加 以 分 析 或 是 对 图 像 中 的 色彩 强度 的 分 布 信息 进行 统计 来 完成 。 基 于 空间 层次 的 识别 方 
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法 则 需要 根据 立体 目标 各 部 分 的 层次 关系 判断 出 其 在 图 像 中 的 方向 和 位 置 。 

针对 不 同 应 用 许 许多 多 的 特征 提取 方法 ， 有 具体 已 在 第 四 章 中 有 详细 的 介绍 ， 这 里 驶 不 再 
展开 。 

(6) 目标 识别 

目标 识别 是 将 目标 从 其 他 景物 中 区 分 出 来 的 过 程 。 目 标识 别 从 识别 对 象 上 来 看 ， 可 分 为 
二 维 图 形 识别 和 三 维 目标 识别 。 

在 对 二 维 图 形 进行 识别 时 ， 需 要 考虑 的 因素 除了 目标 在 图 像 中 的 大 小 、 旋 转 和 位 置 外 ， 
还 有 背景 、 光 照 、 噪 声 等 的 影响 。 这 就 可 能 会 导致 识别 算法 复杂 、 信 息 处 理 量 大 、 计 算 量 大 
等 问题 ， 在 工程 应 用 中 ， 还 需要 考虑 识别 算法 的 实时 性 问题 ;而 在 对 三 维 目标 进行 识别 时 ， 
除了 存在 同 识别 二 维 图 形 一 样 的 困难 外 ， 还 需要 考虑 三 维 目 标 不 同 角 度 观察 时 存在 差异 所 之 
来 的 影响 ， 难 度 更 大 。 
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加 工 工具 进行 识别 分 类 ， 所 用 的 识别 方法 是 一 个 基于 神经 网 络 和 和 矩 特 征 相 结合 的 方法 。 在 识 
别 这 三 种 加 工 工 具 时 ， 为 什么 使 用 神经 网 络 呢 ? 

其 原因 主要 有 两 点 : 首先 ， 加 工 工 具 为 三 维 的 立体 物体 ， 不 同 的 角度 、 距 离 和 工具 在 图 
像 中 的 旋转 情况 十 分 复杂 ， 组 合 干 变 万 化 ， 使 用 以 往 方法 进行 识别 的 准确 率 很 难保 证 ; 其 
次 ， 由 于 可 以 目 由 变化 观测 角度 ， 这 些 物 体 知 用 准确 的 数学 模型 进行 措 述 将 过 于 复杂 ， 很 难 
应 用 。 

因此 ， 选 择 具 有 优 寞 拟 合 能 力 的 神经 网 络 来 进行 工具 的 识别 和 分 类 。 实 现 的 流程 是 : Hi 
先 ， 通 过 计算 机 仿真 建立 所 要 识别 的 三 种 工具 的 三 维 模型 ， 并 采集 其 各 个 角度 的 图 像 获得 一 
个 图 像 序 列 ， 接 着， 预 处 理 图 像 ， 求 每 一 幅 预 处 理 后 图 像 的 7 个 不 变 矩 ， 消 除 图 像 中 平移 、 
旋转 和 尺度 的 影响 ， 并 将 一 组 7 个 不 变 窍 和 代表 该 工具 的 编号 作为 神经 网 络 的 一 个 训练 样 
本 ， 则 一 个 图 像 序列 能 够 得 到 一 组 训练 样本 ;， 然 后， 使 用 这 些 样 本 对 网 络 进行 训练 ， 在 达到 
预 设 的 训练 条 件 之 后 停止 训练 ， 最后， 使 用 目 适 应 强 分 类 器 对 网 络 性 能 进行 进一步 优化 。 所 
得 到 的 由 若干 神经 网 络 组 成 的 自 适应 强 分 类 器 即 可 用 来 识别 目标 ， 本 节 最 后 将 对 比 单个 神经 
网 络 和 优化 后 的 网 络 的 识别 结果 。 

需要 说 明 的 是 ， 神 经 网 络 具 有 民 好 拟 合 能 力 的 同时 ， 其 训练 过 程 很 耗费 系统 资源 ， 上 具体 
使 用 要 依据 所 搭载 的 硬件 平台 酌情 选择 。 此 外 ， 神 经 网 络 本 身 类 似 于 一 个 黑箱 ， 在 训练 好 之 
后 ， 其 内 部 无 法 用 十 分 精确 的 数学 模型 描述 ， 识 别 的 准确 率 和 常常 无 法 达到 100%。 因 此 ， 要 
保证 完全 准确 的 识别 京 ， 需 要 采用 其 他 识别 方法 。 
LAE 神经 网 络 简介 

1. 神经 网 络 的 概念 

人 工 神 经 网 络 ， 也 称 为 神经 网 络 ， 是 一 种 模仿 大 脑 神 经 联系 进行 信息 处 理 的 数学 模型 。 
它 是 对 人 脑 的 抽象 、 简 化 和 模拟 ， 反 映 人 脑 的 基本 特征 。 

神经 网 络 是 一 种 运算 模型 ， 它 由 大 量 的 神经 元 节点 和 它们 之 间 带 有 权重 的 连接 构成 。 每 
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个 节点 相当 于 一 种 特定 的 输出 函数 ， 称 为 激励 函数 。 每 两 个 节点 间 的 连接 都 代表 一 个 对 于 通 
过 该 连接 信号 的 加 权 值 ， 称 之 为 权重 ， 相 当 于 神经 网 络 的 记忆 。 网 络 的 输出 则 依据 网 络 的 连 
接 方式 、 权 重 和 激励 函数 的 不 同 来 决定 。 

神经 网 络 与 普通 数字 计算 机 相 比 ， 有 如 下 的 特点 。 > 

(D 非 线性 。 人 工 神经 元 处 于 激活 或 者 抑制 两 种 状态 ， 这 种 行为 在 数学 上 就 表现 为 一 种 
非 线 性 关系 。 

(2) 非 局 限 性 。 一 个 神经 网 络 通常 由 多 个 神经 元 广泛 连接 而 成 。 通 过 单元 之 间 的 大 量 连 
接 ， 模 拟 大 脑 的 非 局 限 性 。 

(3) 非常 定性 。 人 工 神经 网 络 具 有 自 适 应 、 自 组 织 、 自 学 习 的 能 力 。 不 在 处 理 信息 的 同 
时 ， 非 线性 动力 系统 本 身 也 在 不 断 变化 。 

(4) 非 凸 性 。 系 统 具 有 多 个 较 稳 定 的 平衡 态 ， 这 将 导致 系统 演化 的 多 样 性 。 

2. 生物 神经 元 模型 

人 工 神 经 网 络 是 对 生物 神经 网 络 的 模仿 ， 在 介绍 人 工 神 经 网 络 之 前 ， 有 必要 对 构成 生物 
神经 网 络 的 基础 一 一 生物 神经 元 做 一 个 了 解 。 

医学 研究 表明 ， 人 类 大 脑 皮层 中 大 约 包 含 100—140 亿 个 神经 元 、60 万 亿 个 神经 突 
触 ，1000 万 亿 个 联系 纽带 。 神 经 元 之 间 通 过 相互 连接 形成 错综复杂 而 又 灵活 多 变 的 神经 网 
络 系统 。 

神经 系统 的 基本 结构 和 功能 单位 是 神经 元 细胞 ， 它 主要 由 细胞 体 、 树 突 、 轴 突 和 突 触 组 
成 ， 如 图 5-5 Br. 
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图 5-5 生物 神经 元 





有 一 些 神经 元 只 有 一 条 纤维 ， 称 为 单 极 神经 元 ， 有 些 神经 元 有 一 个 轴 突 和 一 个 树 突 ， 
称 为 两 极 神经 元 ; 很 多 神经 元 有 一 个 轴 突 和 多 个 树 突 ， 称 为 多 极 神 经 元 。 人 和 其 他 兰 椎 动 
物 兰 神经 中 的 感觉 神经 元 只 伸 出 一 条 纤维 ， 但 在 离开 细胞 体 不 远 处 分 为 两 文 : 一 支 到 感受 
髓 ， 称 为 周围 文 ; 另 一 文 进 入 疹 敌 ， 称 为 中 枢 文 。 前 者 是 传 入 纤维 ， 将 来 目 感受 堪 的 感觉 
冲动 传 入 细胞 体 ， 所 以 从 功能 上 看 应 是 树 突 ， 但 却 有 轴 突 的 结构 ;后 者 从 功能 和 结构 上 看 
都 肯定 是 轴 突 。 

神经 元 具有 以 下 基本 特性 。 

d) 时空 整合 功能 。 
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(2) 动态 极 化 性 。 

(3) 兴 香 与 抑制 状态 。 

(4) 结构 可 塑性 。 

(55 脉冲 与 电位 信号 的 转换 。 

(6) 突 触 延期 和 不 延期 。 

CI) 学 习 、 遗 态 和 疲劳 。 

神经 网 络 是 大 量 的 神经 元 相互 连接 而 构成 的 网 络 系统 。 但 是 ， 神 经 网 络 的 模型 只 是 对 生 
物 神 经 网 络 的 简化 和 模拟 ， 并 不 能 够 完全 反映 大 脑 的 功能 。 

3. 神经 网 络 模 型 

类 似 于 生物 神经 网 络 ， 人 工 神经 网 络 也 是 由 人 工 神经 元 为 基本 单元 构成 的 ， 其 中 信息 的 
处 理 主要 由 网 络 各 个 节点 之 间 连 接 的 权 值 决定 。 网 络 在 使 用 之 前 需要 进行 训练 ， 训 练 的 过 程 
实际 上 就 是 不 断 修正 和 调整 各 个 权 值 的 过 程 。 

人 工 神 经 元 是 模拟 生物 神经 元 的 数学 模型 ， 同 时 也 是 一 个 多 输入 单 输出 的 非 线 性 元 件 ， 
如 图 5-6 所 示 。 
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图 5-6 简单 人 工 神 经 元 模型 


神经 元 的 每 一 个 输入 量 x 都 相应 有 一 个 相关 联 的 权重 wy。 处 理 区 计算 输入 及 其 对 应 的 
权重 值得 到 加 权 之 和 ， 计 算出 唯一 的 输出 量 ， 这 个 输出 量 ”是 权重 和 的 函数 ， 称 为 传递 函 
数 。 这 个 过 程 可 以 用 公式 (5-9) 表示 为 


iX] (5-9) 
J 
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不 同类 型 的 神经 网 络 玉 用 的 传递 函数 往往 会 有 所 不 同 ， 传 递 函 数 的 不 同 也 使 得 各 种 神经 
网 络 在 结构 和 功能 上 会 有 差 寞 ， 委 见 的 传递 浮 数 如 图 5-7 所 示 。 

神经 网 络 由 排列 成 层 的 处 理 单元 组 成 ， 接 收 输入 信号 的 神经 元 层 称 输入 层 ， 输 出 信号 的 
俐 经 元 层 称 输出 技 ， 个 和 卫 接 与 输入 输出 发 生 联 系 的 神经 元 层 称 为 中 间 层 或 者 隐 层 。 隐 层 因 为 
权重 的 作用 ， 其 输出 可 能 与 输入 层 有 很 大 兰 异 。 
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a = hardlim(n) a = purelin (n) a = logsig(n) D 
a) b) c) 
图 5-7 常用 的 传递 函数 示意 图 
a) WERE (HEN b) 线性 函数 c) Sigmoid 函数 


一 般 情 况 下 ， 网 络 的 传递 水 数 一 旦 选 定 ， 束 保持 不 变 。 训 练 过 程 所 改变 的 主要 是 网 络 的 
权重 ， 权 重用 以 存储 最 重要 的 信息 。 

4. 神经 网 络 训练 

在 人 确定 神经 网 络 的 结构 之 后 ， 束 要 对 其 进行 训练 。 网 络 的 训练 是 徘 改 变 网 络 中 连接 的 权 
重 来 实现 的 ， 也 就 是 说 ， 神 经 网 络 的 训练 过 程 也 就 是 重新 确定 这 些 权 重 的 过 程 。 需 要 说 明 的 
是 ， 训 练 和 学 习 是 一 对 概念 ， 训 练 是 指 神经 网 络 的 学 习 过 程 ， 而 学 习 是 此 过 程 的 结果 。 训 练 
是 外 部 过 程 ， 学 习 是 内 部 过 程 。 

由 于 神经 网 络 的 结构 、 性 质 、 各 不 相同 ， 相 应 的 学 习 算 法 也 不 同 。 主 要 分 为 两 种 学 习 
7 

(OD 有 监督 学 习 。 要 求 同 时 给 出 输入 和 期 望 的 输出 ， 网 络 根据 当前 输出 与 期 望 输出 的 差 
措 来 调整 内 部 权 值 。 

(2) 无 监督 学 习 。 只 需要 给 出 一 组 输入 ， 网 络 能 逐渐 演变 ， 并 对 输入 的 某 种 模式 做 出 特 
定 回 应 。 这 类 网 络 没有 期 望 输 出 ， 故 不 能 用 于 函数 拟 合 。 

神经 网 络 的 尝 习 规则 有 共 体 主要 包括 如 下 几 种 。 

1) Hebb 学 习 规则 。 

2) 纠 错 学 习 规 则 ， 也 称 Widrow-Hoff 学 习 规则 。 

3) 基于 记忆 的 学 习 规 则 。 

4) 随机 学 习 规 则 。 

5) x^ ^6 24 UU 

5. 常见 神经 网 络 类 型 

按照 不 同 的 结构 、 功 能 、 学 习 算 法 ， 可 将 神经 网 络 分 为 如 下 几 类 。 

(1) 感知 器 神经 网 络 

最 简单 的 神经 网 络 ， 只 有 单 层 结构 ， 传 递 函 数 采 用 便 限 值 冰 数 ， 适 用 于 人 简单 的 线性 二 类 
划分 问题 。 

(2) 线性 神经 网 络 

线性 神经 网 络 是 单 层 结构 网 络 ， 传 递 函 数 为 线性 图 数 ， 可 用 于 线性 函数 的 拟 合 和 通 近 。 

(3) BP 神经 网 络 

BP 神经 网 络 即 误差 反 回 传 播 网 络 ， 是 应 用 最 为 广泛 的 网 络 ， 网 络 结构 较为 灵活 ， 通 第 
可 以 是 三 层 或 者 更 多 ， 因 此 隐 含 层 数 有 至 少 一 个 。 

BP 网 络 采 用 Widrow-Hoff 学 习 算 法 和 非 线性 传递 函数 ， 最 早 的 BP 网 络 训练 时 采用 的 是 
梯度 下 降 算 法 。 而 今 ， 己 出 现 了 许多 优化 算法 ， 如 变 尺度 算法 和 牛顿 算法 ， 而 目前 最 快 的 训 
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练 算法 是 Levenberg-Marquardt 算法 。 

BP 网 络 能 够 以 任意 精度 远近 任何 非 线性 函数 ， 能 够 提取 出 更 高 阶 的 统计 性 质 。 

(4) 径 问 基 神 经 网 络 (RBF 神经 网 络 ) 

径 问 基 神 经 网 络 又 称 为 RBF 网 络 ， 是 一 种 多 层 前 癌 网 络 ， 也 能 够 以 任意 精度 逼近 任何 
JETER JEMENA BP 网 络 的 主要 区 列 在 于 传递 轴 数 不 同 。 径 同 基 神经 网 络 为 径 回 
AERA, qf BP 神经 网 络 名 为 Sigmoid PE ZB EX TE PR ZA. 

由 于 采用 了 径 问 其 传递 函数 ，RBF 网 络 相 比 BP 网 络 训练 速度 快 ， 同 时 和 窗 化 了 计算 ， 收 
化 性 好 ， 适 合 独 数据 的 处 理 。 

(5) 竞争 神经 网 络 

苑 和 争 人 神经 网 络 的 特点 在 于 其 各 个 神经 元 之 间 是 相互 苋 争 的 关系 ， 许 多 神经 元 之 间 相 互 苋 
争 来 决定 出 胜 者 ， 获 胜 的 神经 元 决定 哪 一 种 原型 模式 最 能 够 代表 输入 模式 。 因 此 苋 争 神经 网 
络 非常 适应 于 模式 分 类 的 问题 。 

(6) 反馈 神经 网 络 CHopfield 神经 网 络 ) 

反馈 神经 网 络 是 一 种 反馈 动力 学 系统 。 在 这 种 网 络 中 ， 每 个 神经 元 同时 将 目 喘 的 输出 信 
号 作为 输入 信号 反馈 给 其 他 神经 元 。 

CI) 随机 神经 网 络 

随机 神经 网 络 是 在 神经 网 络 中 引入 了 随机 机 制 而 产生 的 ， 一 个 经 典 的 范例 是 采用 基于 统 
计 物 理 的 模拟 退火 算法 进行 训练 的 Boltzmann 随机 网 络 模型 。 

6. BP 神经 网 络 

目前 神经 网 络 应 用 最 广 的 是 BP 神经 网 络 及 其 变化 形式 ， 本 文 实 验 所 用 网 络 就 是 BP 神 
经 网 络 。 

BP 神经 网 络 义 称 为 误差 反问 传播 俐 经 网 络 ， 它 是 一 种 多 层 前 问 型 俐 经 网 络 。 在 BP 网 络 
中 ， 信 号 是 前 问 传播 的 ， 而 误差 是 反问 传播 的 。 

所 谓 反 回 传 播 是 指 误差 的 调整 过 程 是 从 最 后 的 输出 层 依次 癌 之 前 各 层 逐 渐进 行 的 。 标 准 
的 BP 网 络 采 用 梯度 下 降 算 法 ， 与 Widrow-Hoff 学 习 规则 相似 ， 网 络 权 值 沿 着 性 能 函数 的 梯 
度 的 反问 调整 。 当 前 也 出 现 了 很 多 改进 的 学 习 算 法 。 
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(1) BP 神经 网 络 结构 
1) BP 网 络 神经 元 模型 


图 5-8 为 一 个 基本 的 BP 神经 元 模型 结构 ， 该 神经 D 
元 具有 R 个 输入 。 每 一 输入 被 赋予 相应 的 权 值 ， 求 这 些 o i 
输入 的 加 权 和 之 后 与 偏差 共同 组 成 该 神经 元 传递 函数 的 ”“ 
输入 。 = 

BP 网 络 神经 元 常用 的 传递 函数 如 图 5-9 所 示 。 MM 

需要 指出 ，sigmoid 性 传递 函数 的 曲线 形状 是 S xp 8 BPTHRUUBUEASERE 
的 log-sigmoid、tan-sigmoid 型 函数 都 是 如 此 。 

如 果 BP 网 络 的 输出 层 采 用 sigmoid 型 函数 ， 那 么 网 络 的 输出 值 束 限制 在 [-1,+1] 之 内 ， 
如 果 采 用 线性 函数 purelin 作为 输出 层 的 传递 函数 ， 那 么 输出 可 以 取 任 意 值 。 

2) BP 神经 网 络 结构 

图 5-10 显示 了 一 个 具有 RR 个 输入 ， 有 8 个 logsig 神经 元 构成 的 单 层 网 络 。 图 中 是 一 向 








a-f (Wp+b) 
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量 形 式 表示 的 结构 图 。 








a=logsig(n) a= tansig(n) a — purelin(n) 
a) b) C) 
图 5-9 BP 神经 元 利用 的 几 种 传递 函数 
a)logsig 函数 b)tansig 函数 c) 线性 函数 





Input Layer of logsig Neurons 





a-logsig( Wp-b) 


图 5-10 单 层 logsig 神经 元 构成 的 网 络 结构 





前 向 型 神经 网 络 常 具有 一 个 或 多 个 由 sigmoid 神经 元 构成 的 隐 层 ， 以 及 一 个 由 线性 神经 
元 构成 的 输出 层 。 多 个 具有 非 线 性 传递 函数 的 神经 元 层 使 网 络 可 以 学 习 和 输入 和 输出 之 间 的 非 
线性 关系 ， 而 线性 输出 层 使 得 网 络 可 以 产生 [=-1,+1] 之 外 的 输出 值 。 

但 是 唇 需 要 对 网 络 的 输出 值 域 加 以 限制 ， 那 么 输出 层 束 应 该 采用 sigmoid 类 型 的 传递 
PR ZA. 

(2) BP 网 络 学 习 规 则 

BP 网 络 的 学 习 是 有 监督 学 习 ， 训 练 过 程 需 要 提供 输入 同 量 p 和 期 望 啊 应 r 训练 过 程 
中 网 络 的 权 值 和 偏差 根据 网 络 误 大 情况 不 断 进 行 调整 ， 最 终 实现 期 户 的 功能 。 前 问 型 神经 
网 络 仍然 采用 均 方 误差 作 为 默认 的 网 络 性 能 函数 ， 网 络 学 习 的 过 程 束 是 使 均 方 误 磊 最 小 化 























的 过 程 。 
BP 网 络 的 学 习 算 法 有 很 多 变化 形式 ， 其 中 最 简单 的 BP 算法 仍然 是 最 速 下 降 法 (梯度 法 )。 
1) BP 算法 








BP 算法 沿 着 误差 函数 减 小 最 快 的 方向 ， 也 即 梯度 的 反方 向 改变 权 值 和 偏差 。BP 算法 的 
达 代 计算 公 却 可 以 表示 为 〈5-10): 
XQ = X, 0,8, (5-10) 
HP, ox ARSA BUEN AE x RRR EI PM XIPPBSUOBCS TRZS. g 为 
HIRA RAE, a [VE E CHER. 
榜 度 下 降 算 法 的 实现 分 为 递增 模式 和 批 处 理 模式 两 关 。 在 递增 模式 下 ， 网 络 每 获得 一 个 
狐 的 样 本 ， 束 计算 一 次 标 度 并 更 新 权 值 ; 而 在 批 处 理 模式 下， 网 络 需 要 获得 所 有 的 样本 ， 然 
后 根据 所 有 的 输入 样本 来 更 新 权 值 。 
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2) 批 处 理学 习 算 法 

在 批 处 理 模式 下 ， 网 络 权 值 和 偏差 只 在 整个 输入 样本 集 都 已 经 获取 之 后 才 进 行 更 狐 。 将 
每 次 样本 输入 时 计算 得 到 的 梯度 加 起 来 ， 得 到 最 终 的 权 值 和 俩 差 。 

标准 的 梯度 下 降 算 法 和 有 动量 的 梯度 下 降 算法 应 用 于 实际 问题 时 往往 有 学 习 速 率 过 慢 的 
缺陷 ， 而 且 容易 陷入 局 部 极 小 点 的 缺点 ， 因 此 人 们 提出 了 多 种 改进 的 高 效 BP 算法 。 这 些 快 
速 学 习 算 法 主要 分 为 两 类 : 

第 一 类 是 启发 性 学 习 算 法 ， 包 括 可 变 学 习 速 率 的 梯度 下 降 法 、 有 动量 梯度 下 降 法 、 弹 性 
梯度 下 降 法 等 。 

第 二 类 则 是 基于 最 优化 理论 的 训练 算法 ， 包 括 共 辆 梯度 算法 、 拟 牛顿 法 、Levenberg- 
Marquardt 算法 等 。Levenberg-Marquardt 算法 目前 由 于 收敛 速度 非常 快 而 被 广泛 应 用 。 



































5.4.2 识别 算法 实现 流程 








使 用 神经 网 络 识 别 不 同 目标 时 ， 肯 先 需 要 用 样本 对 神经 网 络 进行 训练 ， 每 一 个 样本 由 两 
部 分 组 成 : 训练 输入 和 期 望 得 出 。 训 练 输入 为 一 幅 包 含 其 中 一 个 目标 的 网 像 ， 而 期 望 得 出 为 
12 H NDS PB UTERE. 

为 了 获得 准确 的 识别 结果 ， 需 要 用 大 量 样 本 对 网 络 进行 训练 ， 即 需要 大 量 的 图 像 序 
列 。 但 是 ， 一 幅 图 像 中 包含 看 大 量 的 信息 ， 不 但 对 于 识别 没有 帮助 ， 还 使 得 网 络 训 练 十 分 
困难 。 为 此 ， 本 书 及 用 求 取 不 变 窍 的 方法 将 一 幅 图 像 转化 为 包含 7 个 数字 的 一 组 不 变 窃 。 
其 体 的 方法 是 来 取 每 一 幅 图 像 的 不 变 矩 ， 将 这 个 图 像 对 应 的 不 变 沧 和 图 像 中 目标 的 代号 作 
为 一 组 训练 样本 。 这 样 获得 的 训练 样本 将 大 大 简化 ， 减 少 了 干扰 因素 ， 有 短 了 训练 时 间 ， 
提高 了 识别 准确 率 。 

但 是 在 求 不 变 窍 之 前 ， 还 需要 对 疼 像 进行 一 定 的 预 处 理 ， 尽 可 能 沽 除 干 扰 ， 并 将 图 像 二 
值 化 ， 为 求 不 变 算 做 好 准备 。 

在 得 到 相应 的 训练 样本 之 后 ， 建 六 BP 神经 网 络 ， 并 使 用 这 坚 训练 样本 训练 网 络 。 训 疆 
结束 之 后 就 可 以 使 用 神经 网 络 来 识别 并 分 类 工具 了 。 最 后 ， 为 了 进一步 提高 识别 的 准确 率 ， 
利用 强 分 类 占 提 升 网 络 性 能 。 

由 此 ， 识 别 握 法 的 实现 流程 可 以 依次 分 为 下 面 的 一 些 步 又 。 

1) 获取 图 像 序 列 。 获 得 所 要 识别 对 象 各 个 角度 的 图 像 。 

2) 图 像 预 处 理 。 二 值 化 为 适合 求 不 变 矩 的 图 像 。 

3) 求 不 变 矩 。 求 预 处 理 之 后 儿 像 的 不 变 矩 ， 所 得 到 的 不 变 矩 具有 平移 、 旋 转 、 斥 度 不 









































变性 。 
4) 生成 神经 网 络 的 训练 样本 。 将 得 到 的 不 变 怎 和 对 应 的 期 班 输出 作为 神经 网 络 的 训练 
样本 ， 并 且 由 于 样本 集 包 含 了 所 要 识别 目标 各 个 角度 的 网 像 ， 又 经 过 求 不 变 窍 具有 了 平移 、 
旋转 和 尺度 不 变性 ， 所 以 保证 了 样本 集 的 完备 性 。 

5) 建立 神经 网 络 。 建 立 一 个 BP 神经 网 络 。 

6) 训练 神经 网 络 。 设 定 训练 条 件 ， 并 使 用 得 到 的 样本 对 网 络 进 行 训练 。 

7) 识别 目标 。 使 用 训练 好 的 网 络 识别 目标 ， 此 处 的 目标 指 的 是 一 组 不 变 窍 。 

8) 网 络 性 能 优化 。 使 用 强 分 类 需 进 一 步 提 升 网 络 表 现 。 

下 面 瓯 来 看 一 看 每 一 步 具 体 是 如 何 执行 的 。 
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(1) 获取 图 像 序 列 

为 了 获得 一 个 完备 的 训练 样本 ， 我 们 按照 几 个 工具 的 真实 大 小 和 比例 关系 ， 使 用 Pro/E 
软件 在 计算 机 中 建立 了 对 应 的 仿真 模型 。 并 将 其 导入 三 维 演 染 软件 3ds max. 软件 中 进行 演 
染 ， 以 期 望 尽 可 能 得 到 接近 的 仿真 情况 。 对 于 如 何 按照 目标 物体 建立 与 其 相对 应 的 模型 ， 以 > 
及 如 何 进行 泻 染 ， 这 个 问题 有 较为 成 熟 的 解决 方法 ， 且 不 是 本 音 重 点 ， 故 在 此 不 作 过 多 讨 
论 。 需 要 注意 的 是 ， 为 了 方便 后 续 图 像 采 集 ， 尽 量 将 造型 时 的 坐标 原点 建立 在 物体 中 心 位 
置 。 那 么 ， 剩 下 来 的 问题 即 为 如 何 获取 图 像样 本 集 。 

如 上 文 所 述 ， 目 标 图 像 的 采集 目的 是 要 得 到 目标 物体 各 个 角度 的 图 像 。 由 于 物体 在 造型 
软件 中 可 以 围绕 原点 进行 定点 转动 ， 摄 像 机 和 物体 相对 位 置 固定 时 ， 可 不 考虑 空间 平移 的 情 
况 ， 于 是 问题 的 关键 就 是 ， 通 过 什么 样 的 旋转 方式 可 以 获得 目标 各 个 方向 的 图 像 。 首 先 通 
过 造型 软件 建立 所 要 识别 目标 物体 的 仿真 模型 ， 并 建立 其 空间 运动 的 数学 模型 如 图 5-11a 
所 示 。 

通过 造型 软件 建立 所 要 识别 目标 物体 的 仿真 模型 ， 并 建立 其 空间 运动 的 数学 模型 。 在 
图 5-11a P, Oxyz 为 物体 所 在 空间 坐标 系 ，Ox'y'z' 为 固 联 在 物 休 上 的 随 体 坐 标 系 。 物 体 围 
绕 原点 O 转动 ， 其 在 空间 的 任意 姿态 可 以 通过 进 动 角 wy 、 章 动 角 9 、 自 旋 角 go 来 决定 ， 如 
图 5-11c 所 示 。 由 图 5-11e 可 以 看 出 ， 当 物体 只 发 生 进 动 时 ， 其 围绕 z' 轴 转动 ， 进 动 后 物体 
上 任意 点 在 空间 坐标 系 的 坐标 (x y, z) 与 在 随 体 坐标 系 的 坐标 (x , ,zi ) 存在 如 下 变换 关系 。 
























































X cosy -siny Oj|x x 
y|-|siny cosy 0| y -A(wv) v (5-11) 
E 0 0 Eiz A 


HR, HEREKE E 





cosy -siny 0 
Co cosy i (5-12) 
0 0 ] 
同 理 ， 可 得 物体 的 章 动 变换 矩阵 4(2) ， 目 旋 变 换 和 矩阵 4(p) 。 其 中 
1 0 0 coso -sino 0 
A(0)2|0 cosO -sinð |, ojas cosp 0 (5-13) 
0 sin  cosQ 0 0 ] 











物体 上 任意 点 在 空间 坐标 系 的 坐标 (2% 思 3) 与 在 随 体 坐标 系 的 坐标 (x',y',z") 存在 如 下 变 
TRO TR. 





(5-14) 











显然 ， 通 过 依次 改变 w 、0 、9 —T ZU VI AREE EAA ENR CI 
图 5-11c)。 但 是 这 种 方法 需要 进行 大 量 的 计算 ， 实 际 操作 也 很 困难 。 通 过 分 析 可 以 发 现 ， 后 
面 押 要 使 用 的 不 变 窍 方法 具有 旋转 变换 不 变性 ， 这 也 殉 意 味 痢 物体 围绕 王 赴 于 成 像 平面 的 轴 
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旋转 对 识别 不 产生 影响 。 利 用 这 一 特性 ， 我 们 可 以 将 采集 几 像 时 的 旋转 模型 简化 。 





a) b) c) 
图 5-11 物体 在 空间 坐标 系 中 的 表示 
a) 空间 坐标 系 和 随 体 坐 标 系 ”b) 进 动 运动 ”6) 空间 任意 点 的 变换 


如 图 5-12 所 示 ， 摄 像 机 在 采集 物体 图 像 时 ，M 为 图 像 中 心 ，M' 为 物体 旋转 中 心 ， 成 像 
平面 a 与 过 M' 的 平面 垂下，MWM' 为 过 图 像 中 心 且 垂直 于 a 平面 的 直线 ， 物 体 在 绕 
MM ' 轴 的 旋转 运动 不 影响 识别 。 于 是 ， 不 妨 将 MM' 直线 取 作 进 动 运动 的 Z 轴 ， 则 物体 在 
Z 轴 周 向 不 发 生 进 动 运动 ， 即 在 图 像 中 旋转 只 发 生 在 自转 轴 b; 随 章 动 运动 9 运动 到 垂直 于 成 
像 平 面 时 。 此 时 ， 物 体 上 任意 点 在 空间 坐标 系 的 坐标 (x,y,z) 与 在 随 体 坐 标 系 的 坐标 
(x' yz") 变换 关系 可 简化 为 式 C5-15): 


X x 
y |= A(0)A(o)| y' 

















(5-15) 








图 5-12 ”目标 旋转 和 图 像 采 集 


取 物 体 上 任意 一 点 P， 其 在 随 体 坐 标 系 下 的 坐标 为 (x'p,y'p,z'p) M 为 物体 的 随 体 坐 
标 系 原点 和 旋转 中 心 ，P 到 M' 的 距离 Ro 始终 不 变 ， 为 Rs = xy zh. Eee RT 
以 得 到 已 点 的 万 外 一 个 坐标 表达 却 : 
X'p», = Rp sin pcosO 
y'p, 7 Rp sin osin 8 (5-16) 
Z'j = Rp COs O 


A (5-16) 即 为 P 点 在 随 体 坐标 系 下 的 球面 坐标 表达 式 ， 这 总 味 看 通过 改变 9 和 8 的 
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fH, P 点 可 以 出 现在 以 M' 为 圆心 Rp 为 半径 的 球面 上 。 上 述 公式 证 明了 通过 改变 革 动 角 0 和 
目 旋 角 g 束 可 以 得 到 物体 各 个 方 回 的 图 像 。 

本 文 所 采取 的 图 像 洲 集 策 上 略为 通过 依次 改变 革 动 角 9 和 目 旋 角 o 的 值 来 获得 模型 目标 的 
图 像 。 采 用 的 镜头 焦距 为 43.46mm， 视 场 角 为 45°. Ed 5-13 所 示 为 三 种 工具 的 草 动 角 从 
100° 人 到 190° 过 程 中 采集 到 的 大 干 图 像 。 本 文 侧重 于 对 方法 的 讨论 ， 所 以 采用 每 次 旋转 10? 的 
方法 ， 即 革 动 角 每 转 过 10"， 目 转 一 周 。 这 样 ， 当 章 动 角 转 过 一 周 后 ， 每 个 工具 模型 可 以 得 
到 1296 幅 图 像 。 依 照 这 个 方法 得 到 的 图 像 束 构成 了 人 神经 网 络 训练 的 样本 集合 。 














加 











c) 
图 5-13 三 种 工具 模型 在 章 动 角 100" —190* 时 取出 的 若干 幅 图 像 示意 
a) 鱼子 模型 ”b) 包子 模型 c) 钳子 模型 


由 于 这 些 工具 为 左右 对 称 结构 ， 实 验 采 集 从 0978 190985 711 幅 图 像 ， 三 个 工具 总 共 采 
集 2133 幅 图 像 。 

该 方法 的 主要 优势 在 于 可 以 较为 方便 地 获得 三 维 目标 各 个 角度 的 图 像 ， 节 约 了 成 本 。 但 
需要 说 明 的 是 ， 该 方法 对 于 仿真 程度 和 预 处 理 结果 依赖 较 大 ， 对 于 背景 、 光 照 和 物体 表面 材 
质 较 为 敏感 。 减 小 采样 间隔 (采集 时 每 次 旋转 的 角度 )， 以 及 提高 仿真 程度 (模型 和 场景 的 
真实 程度 )， 能 够 有 效 提 高 使 用 该 方法 时 的 识别 正确 率 。 

(2) 图 像 预 处 理 

由 于 需要 对 目标 求 不 变 矩 ， 而 且 目 标 属于 形状 特征 明显 而 纹理 特征 不 明显 的 类 型 ， 沦 试 
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将 其 转化 为 二 值 图 像 以 方便 求 不 变 矩 。 较 为 合适 的 预 处 理 方法 有 二 值 化 。 之 所 以 不 适用 滤波 
和 去 噪 是 因为 此 处 所 使 用 的 图 像 为 计算 机 生成 ， 不 存在 噪声 ， 并 且 求 不 变 矩 后 噪声 的 影响 几 
乎 可 以 忽略 不 计 。 经 过 二 值 化 后 的 图 像 如 图 5-14 所 示 。 


TUS | n 
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图 5-14 二 值 化 处 理 三 种 工具 模型 
a) EFR b) 饥 子 模型 c) 钳子 模型 





(3) SKRAJA RAE 

TE 13 38] 47] s I 48 EFI] SR Je. Xe RH ER HORE ESLER IPIE. UI NR ERE SJ 
xp. EHAR nI ELA SUTH ER EX SEU] H Jo MEE ERD EVE WA T2 0 28 VU XE 
的 4.1 节 。 

(4) 生成 神经 网 络 的 训练 样本 和 识别 样本 

对 预 处 理 后 的 每 一 幅 图 像 ， 求 其 对 应 的 7 个 不 变 矩 ， 得 到 一 个 同 量 序列 ， 该 癌 量 序列 加 
上 目标 输出 即 成 为 神经 网 络 训练 样本 。 而 识别 样本 只 包含 7 个 不 变 矩 。 本 实验 中 ， 期 望 输出 
用 001 代表 包子 ，010 代表 雏 子 ，011 代表 钳子 。 

(5) 建立 神经 网 络 

本 文采 用 BP 神经 网 络 进行 目标 识别 实验 。 网 络 结构 如 图 5-15 所 示 ， 设 计 成 单 隐 含 层 
结构 ， 隐 层 包含 20 个 神经 元 ， 隐 层 神 经 元 传递 函数 为 S 型 函数 ， 输 出 层 含 有 3 个 神经 元 ， 
HAR E BRUN RTE BRL 
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Layer Layer 





Output 





图 5-15 ”识别 用 BP 神经 网 络 结构 
(6) 训练 神经 网 络 
所 使 用 的 网 络 训练 方法 为 Levenberg-Marquardt 算法 ， 其 权 值 调整 可 按 式 (5-17) 进行 : 
Aw= (Tj+ml) TE (5-17) 
其 中 J 了 为 误差 对 权 值 微分 的 Jacobian &REE, E 为 误差 问 量 ，m 为 一 个 标量 。 
以 上 方法 利用 了 近似 的 三 阶 导 数 信 息 ， 既 具有 蜗 斯 - 牛 申 法 的 局 部 收敛 性 ， 又 具有 梯度 





下 降 法 的 全 局 特性 ， 但 比 标 度 算法 收敛 速度 快 很 多 ， 并 且 算 法 稳定 。 


本 文中 ， 设 置 训 练 误差 限 0.00004， 训 练 步 长 0.1， 训 练 周 期 300。 训 练 情 况 如 图 5-16 


ZR o 


Output -= 0.93*Target + 0.029 





Progress 

Performance: 7.28 4. 00-05 
Gradi ent: 131 1. 00-05 
Ma: D. 00100 1. D0et10 


Validation Checks: ol 0 089  ? Js 


Mean Squared Error (mse) 


02 04 O05 408 1 
Targat 100 150 200 


300 Epochs 
图 5-16 ”网 络 训 练 情况 
a) 网 络 训练 参数 b 训练 输出 c) 网 络 表 现 随 训 练 周期 的 曲线 


(7) 识别 目标 
整个 网 络 的 训练 和 识别 过 程 如 图 5-17 所 示 ， 训 练 过 程 需要 图 像 的 7 个 不 变 矩 和 期 望 
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得 出 ;而 识别 过 程 中 ， 将 竺 识别 图 像 的 7 个 不 变 窃 输入 神经 网 络 ， 网 络 将 给 出 识别 判断 的 












结 
pt 
对 应 的 7 个 不 变 矩 
| VII A (训练 输入 ) 
一 个 神经 网 络 | 
| 过 | 后 的 图 像 神经 网 络 
| o 的 训练 用 样本 
| 程 | 《训练 图 ) 对 应 的 目标 代号 
| (期 望 输出 ) 
a a 
一 
ar oes 对 应 的 7 个 不 恋 
© | ( 待 识别 图 ) 
UE o 22222222 


图 5-17 神经 网 络 训练 和 识别 流程 


为 保证 能 够 同步 采样 ， 在 仿真 软件 中 架设 另外 一 架 与 采样 摄像 机 参数 相同 但 位 置 不 同 的 
摄像 机 以 采集 测试 样本 。 对 上 述 三 个 工具 模型 随机 采集 33 HA], AA 99 幅 图 作为 测试 样 
本 。 实 际 识别 的 对 象 是 经 过 计算 得 到 的 99 组 不 变 矩 。 将 这 99 组 不 变 窍 输入 训练 好 的 网 络 ， 
得 到 的 输出 即 为 识别 结果 。 

(8) 网 络 性 能 优化 《〈 目 适应 强 分 类 堪 ， 理 论 简 单 介绍 ) 

为 了 进一步 提升 网 络 的 识别 正确 紊 ， 及 用 目 适 应 强 分 类 右 〈ada-boost) 算法 构建 一 个 神 
经 网 络 的 强 分 类 需 。 访 方法 通过 训练 时 分 类 的 正确 与 否 调整 用 于 下 一 个 网 络 训 练 的 数据 的 权 
午 ， 从 而 使 得 网 络 性 能 得 到 提升 ， 并 根据 多 个 神经 网 络 的 综合 表现 决定 输出 ， 得 到 的 正人 确 率 
局 于 单个 神经 网 络 。 

Ada-boost 理论 由 Freund 和 Schapire 在 1995 年 提出 ， 这 是 一 种 将 弱 学 习 算 法 融合 为 强 
学 习 算 法 的 方法 ， 其 基本 思想 是 : 首先 判断 每 次 训练 后 每 个 样本 的 分 类 是 否 正 确 ， 结 合 上 一 
次 的 分 类 和 情况， 改变 对 应 的 训练 样本 在 学 习 过 程 中 的 权重 。 对 于 分 类 正确 的 样本 ， 降 低 其 在 
下 一 次 训练 中 的 权重 ;而 对 于 分 类 错误 的 样本 ， 增 加 其 在 下 一 次 训练 中 的 权重 。 这 样 ， 分 类 
错 的 那些 样本 吏 因 被 赋予 了 较 高 的 权重 而 凸显 了 出 来 ， 从 而 得 到 一 个 新 的 样本 分 布 。 了 最 后 ， 
将 每 一 次 训练 得 到 的 分 类 器 融合 起 来 ， 作 为 最 终 的 分 类 右 。 其 中 ， 每 一 次 训练 得 到 的 分 类 器 
称 为 弱 分 类 器 ， 最 终 得 到 的 决策 分 类 器 称 为 强 分 类 器 。 

其 主要 步骤 为 : 首先 ， 给 出 样本 空间 和 弱 学 习 算 法 ， 从 样本 空间 得 到 m 组 训练 数据 ， 
并 将 每 组 训练 数据 的 权重 都 设 为 1/m; 然后 开始 训练 弱 分 类 器 ， 每 次 训练 之 后 ， 根 据 分 类 的 
正确 与 人 否 更 新 训练 数据 权重 ， 正 确 分 类 数据 赋予 较 小 权 值 ， 错 误 分 类 数据 赋予 较 大 权 值 。 经 
过 多 次 训练 ， 得 到 多 个 分 类 的 函数 序列 ， 每 个 弱 分 类 器 为 一 个 分 类 函数 。 也 将 权重 引入 这 些 
分 类 函数 ， 即 分 类 结果 越 好 的 函数 ， 对 应 的 权重 武大 。 最 终 的 强 分 类 函数 由 弱 分 类 函数 加 权 
得 到 。 对 应 的 处 理 流 程 如 图 5-18 所 示 。 

该 方法 的 优点 是 ， 不 管 使 用 哪 类 神经 网 络 ， 都 可 以 用 该 方法 来 对 其 识别 正确 率 进 行 提 
升 ， 是 一 种 适用 范围 广泛 的 网 络 性 能 提升 方法 。 
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神经 网 络 1 
神经 网 络 2 N 
神经 网 络 n 


图 5-18 ” 强 分 类 器 处 理 流 程 














如 图 5-19 所 示 ，ada-boost 方法 的 具体 实施 步 又 包括 数据 选择 和 网 络 初 始 化 、 弱 分 类 丹 
预测 、 计 算 分 类 权重 序列 、 训 练 数据 权重 调整 和 构建 强 分 类 函数 征 。 


数据 选择 和 - 计算 预测 测试 数据 o 
网 络 初始 化 Sie 权重 序列 权重 调整 BT HUR 





图 5-19  ada-boost 强 分 类 器 实现 过 程 


1) 数据 和 网 络 初始 化 。 从 样本 空间 中 随机 选择 m 组 训练 数据 ， 将 每 组 数据 的 分 布 权 值 
初始 化 为 DGOD) 21/m ， 根 据 样本 输入 输出 维 数 确定 神经 网 络 输入 层 和 输出 层 结构 ， 初 始 化 神 
经 网 络 权 值 和 靖 值 。 

2) 弱 分 类 器 预测 。 训 练 第 t 个 弱 分 类 器 时 ， 用 训练 数据 训练 神经 网 络 并 预测 训练 数据 
输出 ， 且 可 按 公 式 〈(5-18) 计算 分 类 序列 g(O 的 分 类 误 关 和 ev 





e, =ò D(i) i-L2,-,m(g(t)z y) (5-18) 





AP, e(2yfulll4 2S z5 SR. y 为 期 望 分 类 结果 。 
3) 计算 分 类 权重 序列 。 根 据 分 类 序列 g(0) 的 分 类 误差 e 计算 序列 的 权重 ww， 权 重 计 算 公 
式 如 式 〈$-19) 所 示 : 














a, [A (5-19) 

4) 训练 数据 权重 调整 。 根 据 分 类 序列 权重 a, 调整 下 一 轮训 练 样 本 的 权重 ,调整 公式 
如 下 。 

D, (i) B 20 * exp[-a, Yi 8i (x; )] j-l2,-,m (5-20) 


1 











式 中 ，B, 是 归 一 化 因子 ,目的 是 在 权重 比例 不 变 的 情况 下 使 分 布 权 值 和 为 1。 
5) 强 分 类 函数 。 假 设 训练 T 轮 后 得 到 7 2H992) 2S TRAC f (g,.a, E T ATRA 
f(g a, ) 和 调整 权重 w 组 合 得 到 了 强 分 类 函数 h(x)， 且 有 : 


T 
h(x) -binariation Y'a f(g,,a, ] (5-21) 


t=1 





由 于 本 文中 训练 输出 为 0 和 1 的 二 值 数 据 ， 所 以 对 结果 进行 二 值 化 处 理 。 处 理 的 流程 如 
图 5-20 所 示 。 
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初始 一 一 
€ 5 (i)=1/m 训练 样本 


D,(i) 
B, 


m 训练 
Hil 
第 k 个 网 络 
( 弱 分 类 器 ) 
调整 权 值 Ot; 


判断 是 是 - 


a f a) h(x)-binarization ps a, -f(g, a) | 
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Dyj(i)- *exp[—ar yi g: (x;)] 














d= -in( le ) 
2 er 





SENE 例 程 精 讲 


例 程 5-1: 如 何 建立 、 训 练 并 且 仿 真一 个 BP 神经 网 络 

方法 1: 通过 MATLAB 目 带 的 GUI 工具 建立 神经 网 络 

这 个 例子 中 ， 使 用 MATLAB 自 带 的 神经 网 络 GUI 工具 建立 一 个 单 隐 含 层 的 BP 神经 网 
络 ， 其 中 隐 含 层 包含 20 个 神经 元 ， 输 入 变量 7 个 ， 输 出 变量 3 个 。 

H^c. H8] GUI 工具 ， 在 MATLAB 工作 区 中 输入 : 











nntool 





该 命令 将 打开 一 个 Network/Data 管理 窗口 ， 界 面 如 图 5-21 所 示 。 

从 图 中 可 见 ，Network/Data 管理 窗口 分 为 7 个 区 域 ， 下 方 有 7 个 按钮 。 各 个 区 域 的 作用 
如 下 。 

(1) Input Data: 用 户 指 定 输入 样本 。 

(2) Target Data: 用 户 指 定期 望 目标 啊 应 。 

(3) Input Delay States: 设 定 输入 延迟 。 

(4) Networks: 神经 网 络 。 

(5) Output Data: 仿真 输出 。 

(6) Error Data: 4€ 2] Y& 2c. 

(7) Layer Delay States: 网 络 各 层 的 延迟 状态 。 
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上 Neural NHetwork/Data Nanager (nntool) 


Input Data: Networks Üutput Data: 


E Data: Error Data: 


Input Delay States: 





© Layer Delay States: 





图 5-21 Network/Data 管理 窗口 


各 个 按钮 作用 如 下 。 

(1) Import: 从 工作 区 或 指定 地 址 导入 数据 。 

(2) New: 新 建 网 络 或 数据 。 

(3) Open: 打开 网 络 或 数据 ， 进 而 能 够 进行 租 看 、 编 辑 、 训 练 、 仿 真 等 操作 。 

(4) Export: 将 数据 导出 到 工作 区 或 指定 地 址 。 

(5) Delete: 删除 所 选项 。 

(6) Help: 获取 帮助 。 

(7) Close: 关闭 窗口 。 

由 于 训练 数据 是 现成 的 ，inputmodel 将 作为 训练 的 输入 ，outputmodel 则 是 期 望 响 应 ， 可 
直接 从 工作 区 中 导入 这 两 个 数据 。 单 击 Import 按钮 后 ， 在 中 间 一 栏 选中 inputmodel， 在 右边 
选中 Input Data 选项 ， 如 图 5-22， 将 inputmodel 作为 输入 样本 。 














Š Iaport to Network/Data Manager 


Source 


OE ia MUS ria 
inputmodel 
O Load from disk file 


inputmodeltest inputaodel 
outputmodel 
outputmodeltest 


Destination 
Name 
MAT-file Name Import ås: 


| j | Network 





© Input Data 





O Target Data 


Qr Initial Input States 


o Initisl Layer States 


Oo Üutput Data 
OQ Error Data 





图 5-22 导入 输入 样本 
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同样 ， 如 图 5-23， 将 outputmodel 导入 ， 作 为 期 望 输出 。 


e Iaport to NHetwork/Data Manager 


Source 


(9 Import from MATLAB workspace 


O Load from disk file 
MAT-file Name 





Browse... 


之 后 ， 单 击 Network/Data 管理 窗口 中 的 New 按钮 ， 创 建 一 个 神经 网 络 。 如 图 5-24 所 
示 ， 出 现 一 个 对 话 框 ， 上 面 有 两 个 选项 卡 ， 可 以 选择 要 创建 网 络 还 是 数据 ， 可 根据 自己 的 需 
求 选择 创建 一 个 名 叫 net 的 BP 神经 网 络 ， 设 定 网 络 的 层 数 、 每 层 的 神经 元 个 数 、 每 层 的 
传递 函数 、 训 练 算法 、 训 练 输入 和 期 望 输出 等 。 单 击 下 方 的 Create 按钮 ， 一 个 网 络 就 创建 


好 了 。 


Select a Variable 


(no selection) 
inputmodel 
inputmodeltest 
outputmodel 


outputmodeltest 





[Destination 

Hame 

Import As: 

| F ! Network 

o Input Data 

®© Target Data 

OQ Initial Input States 
O Initial Layer States 
© Dutput Data 


O Error Data 





图 5-23 ”导入 期 望 输出 


$r Create Hetwork or Data 


Hame 


net 


Hetvork Properties 


Network Type: 


Input data: 
Target data: 


Training function: 


Adaption learning function: 


Performance function: 


Number of layers: 


Properties for: 


Humber of neurons: 


Transfer Function: 














Feed-forward backprop ~ 


图 5-24 ”创建 一 个 BP 网 络 
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XX, Network/Data /E f OFRET ZAIN, uk 5-25 所 示 ， 分 别 是 
inputmodel 输入 样本 、outputmode 期 望 输出 和 net 神经 网 络 。 


A Neural Network/Data Nanager í(nntool) 
Networks Üutput Data: 


inputmodel net 





Target Data: Error Data: 


outputmodel 


(V) Input Delay States: v) Layer Delay States: 





5-25 创建 完成 的 网 络 net 


选中 net， 单 击 Open 按钮 ， 打 开 网 络 。 图 5-26 所 示 即 为 网 络 结构 ， 一 个 单 隐 含 层 的 BP 
神经 网 络 ， 隐 含 层 全 有 20 个 神经 元 、7 个 输入 量 、3 个 输出 量 。 





Network: net 





5-26 ”所 建立 的 BP 网 络 结构 
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选中 Train 选项 卡 可 以 设置 训练 的 输入 输出 ， 以 及 训练 过 程 的 各 项 参数 。 如 图 5-27 和 
图 5-28 所 示 ， 当 各 项 参数 设置 好 后 ， 单 击 下方 的 Train Network 按钮 好 可 训练 。 





Network: net 


Train 

Iraining Info 

Training Data Training Results 
Inputs Outputs [net_outputs | 
Targets Errors |eteres | 
Init Input Delay States Final Input Delay Stateslnet inputStates | 
Init Layer Delay States Final Layer Delay States|net layerStates č | 


W Train Network 





图 5-27 设置 训练 输入 和 期 望 输出 


Network: net 


Train Reinitialize Weights || View/Edit Weights 
Training Farameters 


showllindow 


showCommandLine 


epochs 10000000000 


time 
goal 
min grad 


max fail 


W Train Hetwork 





K|5-28 ”设置 训练 的 各 项 参数 
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训练 结束 后 得 到 一 个 新 的 网 络 。 新 网 络 仍然 存放 在 net 中 ， 选 择 Simulate 选项 卡 ， 可 以 
选择 我 们 的 测试 数据 。 如 图 5-29 所 示 ， 将 inputmodeltest 作为 测试 数据 ， 单 击 Simulate 





Network 按钮 则 开始 仿真 。 网 络 训练 的 好 坏 惑 可 通过 仿真 结果 来 判断 。 


= Hetwork: net 


View| Train| Simulate | Adapt | Reinitialize Weights || View/Edit Weights 


Simulation Data 人 人 人 TSimulation Results 


Inputs Inputmodeltest | Dutputs net outputs 

Init Input Delay States Final Input Delay Statez|net inputStatesz 
B——————À 

Init Layer Delay States Final Layer Delay States|net layerStatesz 


Supply Targets 


Targets [zeros] Errors net errors 




















Simulate Network 











图 5-29 ”设置 仿真 所 用 测试 数据 


方法 2: 使 用 函数 建立 、 训 练 并 仿真 神经 网 络 

使 用 函数 来 建立 神经 网 络 ， 这 里 使 用 newff 函数 来 建立 一 个 前 僻 网 络 ， 并 存放 到 net 这 
个 结构 中 。 在 使 用 newff 时 ， 需 要 提供 4 个 参数 : 

1) 第 一 个 参数 是 输入 数据 的 范围 ， 即 训练 输入 中 输入 样本 的 最 大 值 和 最 小 值 。 通 过 
minmax 闲 数 获得 一 个 7X2 的 矩阵 ,“7” 对 应 神经 网 络 有 7 个 输入 ,“2” 存 放 该 类 输入 的 最 
大 值 和 最 小 值 。 

2) 第 二 个 参数 是 神经 网 络 的 层 数 和 每 层 的 神经 元 的 个 数 。 由 于 神经 网 络 输入 层 的 神经 
元 个 数 与 输入 一 致 ，MATILAB 中 输入 层 就 不 人 算 做 一 层 ， 而 从 左 到 右 依次 与 隐 含 层 神经 元 个 
数 和 输出 层 神经 元 个 数 即 可 。 这 里 建立 的 是 一 个 单 隐 含 层 的 网 络 ,“20” 表 示 隐 含 层 售 有 20 
个 神经 元 ,“3” 表 示 输 出 层 有 3 个 神经 元 。 如 果 要 建立 包含 N 个 隐 含 层 的 网 络 ， 则 数组 中 元 
系 个 数 为 N+1 个 ， 每 个 元 聚 的 数值 对 应 该 层 网 络 的 神经 元 个 数 。 

3) 第 三 个 参数 用 于 设 定 每 层 所 要 用 到 的 传递 疯 数 的 类 型 ，tansig 为 双 曲 正切 S JE RZ, 
purelin NERZ. 

4) 第 四 个 函数 为 所 要 使 用 的 训练 函数 ， 不 同 的 函数 训练 速度 不 同 ， 这 里 使 用 目前 最 快 
的 收敛 函数 之 一 一 一 Levenberg "Marquardt FK Zi. 









































net-newff(minmax(inputmodel),[20,3], ( tansig',purelin'? ,'trainlm'); % 建 并 网 络 





e 








MATLAB retrasa 

当 输 入 上 面 的 这 条 语句 后 ，BP 网 络 束 建立 好 了 。 建 立 好 的 网 络 并 不 能 直接 使 用 ， 需 要 
先进 行 训练 。 但 在 训练 之 前 ， 还 应 该 给 出 训练 的 一 些 条 件 ， 上 具体 的 训练 条 件 根 据 目 己 的 使 用 
需求 来 定 ， 可 以 包括 训练 周期 、 训 练 步 长 、 训 练 误差 限 等 。 

使 用 下 面 的 三 条 语句 设 定 训练 的 参数 。 


net.trainParam.epochs-300; % 设 置 训 练 周期 
net.trainParam.1r-0.1; % 设 定 训 练 步 长 
net.trainParam.goal-0.00004; 963 xe VII ZI] VR 25 RR 


> epochs 用 于 设 定 最 大 训练 周期 ， 此 处 由 于 要 训练 多 个 网 络 ， 设 定 为 300， 即 如 果 训 练 
误差 限 在 不 到 300 周期 是 就 已 达到 指定 值 0.00004， 则 停止 训练 ， 而 若 到 达 300 周期 
后 还 未 达到 指定 误差 ， 则 在 训练 次 数 达 到 300 次 的 时 候 ， 也 停止 网 络 的 训练 。 
> lr 用 于 设 定 训练 步 长 ， 也 即 每 个 训练 周期 中 权重 调整 的 大 小 ， 这 里 为 0.1。 
> goal 为 训练 的 误差 限 ， 也 就 是 训练 结果 和 期 望 结果 之 间 的 误差 ， 选 择 0.00004, Hix 
差 小 于 0.00004 时 就 停止 训练 。 
设置 完成 训练 的 参数 以 后 ， 束 可 以 对 网 络 进行 训练 了 。 使 用 train. 函数 对 网 络 进行 训 
练 ， 该 函数 需要 提供 三 个 参数 。 第 一 个 参数 是 刚才 建立 的 网 络 ， 第 二 个 参数 是 训练 输入 ， 第 
三 个 参数 是 期 望 输出 。 下 面 的 语 名 中， 我们 对 刚刚 建立 的 net 网 络 进行 训练 ， 所 用 的 训练 输 
入 是 inputmodel， 期 望 输出 是 outputmodel， 训 练 好 的 网 络 仍 将 会 存放 在 net 中 。 














[net,tr]j=train(net,inputmodel,outputmode]);% 使 用 inputmodel 和 outputmodel 作为 训练 样本 对 net 进 
行 训练 ， 得 到 的 结果 存放 到 net 中 


训练 完成 后 ， 采 用 sim 函数 进行 网 络 识 别 。 将 随机 拍 援 的 测试 输入 inputmodeltest 输入 
网 络 net 中 ， 得 到 的 结果 存放 在 an. Eh, an 束 是 一 个 包含 测试 结果 的 矩阵 。 
% 测 试 数据 预测 
an-sim(net, inputmodeltest);% 仿 真 网 络 ， 将 inputmodeltest 对 应 的 输出 存放 到 an 中 
例 程 5-2: 使 用 自 适应 强 分 类 器 进行 网 络 性 能 提升 
上 面 的 例子 介绍 了 如 何 建立 、 训 练 并 且 仿 真一 个 神经 网 络 ， 所 获得 的 网 络 即 可 以 用 来 识 
列 目标 。 下 向 介绍 如 何 进一步 提升 网 络 性 能 。 
首先 ， 设 置 一 个 分 布 权 值 D，D 是 一 个 掌管 测试 数据 权重 的 因子 ， 擎 管 数 据 的 分 布 的 权 
值 ， 根 据 预 测序 列 的 权重 w(D) 来 调整 下 一 轮训 练 样 本 的 权重 。 
%% 权重 初始 化 


[mm,nn]-size(inputmodel);?omm 存放 训练 用 输入 样本 的 行 数 ，nn 存放 训练 用 输入 样本 列 数 
D(1;,:)=ones(1,nn)/nn;%D 为 一 个 1 íT nn 列 的 矩阵 ， 里 而 每 个 元 素 都 是 1/nn; D 实际 上 就 是 分 布 权 值 


然后 ， 建 立 10 个 界 分 类 右 ， 这 里 的 一 个 界 分 类 兹 即 为 一 个 神经 网 络 ， 具 体 程 序 如 
FB. 
%% 弱 分 类 器 分 类 


K=10;% 总 共有 10 个 弱 分 类 器 ， 每 个 BP 网 络 作 为 一 个 弱 分 类 器 
for i=1:K %i 为 当前 的 弱 分 类 器 
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仁 3*i-2;% 定 义 一 个 变量 





error(i)=0; %error(i) 是 每 个 弱 分 类 器 的 预测 序列 误差 ， 即 识别 错误 


%BP 神经 网 络 构建 
net-newff(minmax(inputmodel),[20,3], {'tansig','purelin'} ,trainlm"); % 建 立 一 个 可 训练 的 前 馈 网 络 > 
net.trainParam.epochs-300; % 设 定 训 练 周期 

net.trainParam.lr=0.1; % 设 定 训练 步 长 ， 即 每 次 犬 只 调整 的 大 小 

net.trainParam.goal-0.00004; % 设 定 训 练 的 误差 限 ， 当 达到 这 个 值 时 ， 集 止 训练 


%BP 神经 网 络 训 练 
[net,tr]-train(net,inputmodel,outputmodel);96X] net 进行 训练 ， 得 到 的 结果 存放 到 net 中 


% 训 练 数据 预测 

anl1=sim(net,inputmodel);% 仿 真 网 络 ， 将 inputmodel 对 应 的 输出 存放 到 anl 中 
ts1(t:t+2,:)=an1;%tsl 存放 预测 序列 的 原始 数据 
test_simul(t:t+2,:)=im2bw(an1,0.5);%test_simul 就 是 预测 序列 





% 测 试 数据 预测 

an=sim(net,inputmodeltest);% 仿 真 网 络 ， 将 inputmodeltest 对 应 的 输出 存放 到 an 中 
ts(t:tt2,:)=an;%ts 存放 弱 分 类 困 数 的 原始 数据 

test simu(t:t-2,:)-im2bw(an,0.5);9otest simu 其 实 就 是 一 个 弱 分 类 器 得 到 的 识别 结果 


% 统 计 错 误 样 本 数 
for j71:nn %nn 是 列 数 
a-(test simul(tt+2j)~=outputmodel();% 判 断 网 络 的 预测 序列 和 对 应 的 输出 是 否 一 致 ， 








将 结果 存放 在 a 中 ， 硅 相 每 ， 则 a=[0;0;0]， 合 则 a 中 有 为 1 WIR 


if([1 1 1]*a-—0)96: a 中 有 为 1 的 元 素 ， 则 错误 
error(i)=error(i)+D(ij);% 误 差 和 error 的 计算 公式 
end 
end 


% 弱 分 类 髓 1 权重 
at(iD)=0.$*log((1-error(D))/error(D));%atG) 为 每 个 弱 分 类 堪 的 预测 序列 权重 ， 访 式 为 预测 序列 权 


重 计算 公式 


end 


% 更 新 D fH 
for ]=1:nn 

D(i*1,j)-D(i,j)*exp(-at(i)*(test simul(t:t-2,j))*an1(:,j)); % 更 新 D 值 
end 


%D 值 归 一 化 
Dsum=sum(D(i+1,:)); 
D(i*1,:)-D(i*1,:)/Dsum; 


接 下 来 将 得 到 的 弱 分 类 器 组 合成 为 一 个 强 分 类 髓 ， 程 序 如 下 。 












MATLAB 数字 图 像 处 理 实战 


%% 强 分 类 器 分 类 结 采 
for 1-1: K 
1173*1-2; 
at2(ii:ii+2)=at();% 把 at 变 成 一 个 1*30 的 矩阵 at2 
end 
at3=at2'; 
for 1=1:98 
at3=[at3 at2"];% 在 at2 的 基础 上 生成 一 个 与 目标 输出 一 样 大 小 30*99 HERE at3 
end 
output1=at3.*ts;% 将 at3 中 元 素 与 ts 中 元 素 逐 元 素 相 乘 
output2=zeros(3,99);% 生 成 一 个 3x99 I ZB PE 
for j=1:3%3 是 输出 癌 量 的 元 素 个 数 
for i=1:K%K 是 所 要 分 成 的 组 ，10 组 数据 ， 来 目 10 个 弱 分 类 器 
ii-3*i-(3-j);967J T JE outputl 中 的 1,4,7,10...;2,5,8,11...;3,6,9,12... 这 些 行 提取 出 来 相 加 ， 得 
到 一 个 3*99 的 矩阵 
output2(j,:)»output2(j,:)--outputl(ii;)'Veoutput2 用 来 存放 每 3 行 相 加 后 的 元 素 ， 为 一 个 

















3*99 的 矩阵 
end 
end 
output3=0.1*output2;%10 个 弱 分 类 器 累加 ， 最 后 结果 应 该 缩小 10 倍 
output=im2bw(output3,0.33);% 得 到 的 output 应 该 是 一 个 在 结构 上 和 outputmodeltest 一 致 ， 即 3*99 
HAE EE 


得 到 强 分 类 器 和 弱 分 类 器 之 后 ， 将 它们 的 识别 结 末 进行 统计 ， 程 序 如 下 。 


%% 分 类 结果 统计 
% 统 计 强 分 类 器 每 类 分 类 错误 个 数 
kkk1-0; 
kkk2-0; 
kkk3-0; 
for j=1:99%99 是 输出 的 列 数 
b=(output(:,])~=outputmodeltest(:,])); 
if j^21&&j«—33; 
if ([11 1]*b--—0) 
kkk1=kkk1+1;% 统 计 第 一 类 的 识别 错误 数 








end 
end 
if j>=34&&]j<=066; 
if ([1 1 1]*b~=0) 
kkk2=kkk2+1;% 统 计 第 二 类 的 识别 错误 数 
end 
end 
if j2767&&j«—99; 
if ([1 1 1]*b-—0) 
kkk3=kkk3+1;% 统 计 第 三 类 的 识别 错误 数 
end 
end 
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end 


kkk1 

kkk2 

z S 
disp( 第 一 类 分 类 错误 、 第 二 类 分 类 错误 、 第 三 类 分 类 错误 、 总 错误 ); 

% 窗 口 显示 


disp([Kkk1 kkk2 kkk3 kKkk1-kkk2--kkk3 |); 




















plot(output) 
hold on 
plot(outputmodeltest,'g") 


% 统 计 弱 分 类 器 效果 
% 注 意 这 里 用 的 是 test_simu， 是 测 斌 数据， 表达 式 结 构 和 前 面 有 点 像 ， 但 是 前 面 的 目的 是 统计 和 错 
误 了 之 后 修改 权重 ,而且 用 的 是 test_simul， 训 练 用 数据 ， 这 里 是 统计 弱 分 类 器 效果 的 
for 1=1:K 
error1(1)-0; 
t-3*1-2; 
for j-1:99 
a-(test simu(t:t*2,j)-—outputmodeltest(:,));963X PJ IEAA test simu 中 第 ttt+2 1T j 列 是 否 和 
outputmodeltest 中 j 7-94, 41256 3e, M) a-[0:0;0],. AN a 中 一 定 有 为 1 的 元 系 
if ([1 1 1]*a-—0)96: a 中 有 为 1 的 元 素 ， 则 错误 
errorl(i)-error1(1)-1;96 X ZI error 的 计算 公式 
end 




















end 
end 
disp Zt il 99 41 2S ds 2] 2S OR; 
error 
disp( 84) 2S d 2] JS VA 2 AE?) 
(KkKk1--kkk2--kkk3)/99 
displ 95 4) 2S d 2) 2S VA Zi: E 
(sum(errorl/(K*99)) 


(12 BP 神经 网 络 识别 结果 

采用 仿真 模型 方法 消除 了 背景 、 光 照 等 差异 可 能 对 实验 带 来 的 不 利 影 响 。 通 过 使 用 不 变 
矩 消除 了 目标 在 图 像 中 因 平 黎 、 旋 转 和 尺度 变化 产生 的 差异 ; 同时 ， 本 章 还 系统 采集 了 目标 
物体 在 各 个 角度 的 图 像 ， 因 此 ， 本 章 得 到 的 训练 样本 是 完备 的 。 

在 设置 好 各 类 参数 之 后 ， 通 过 2133 组 样本 训练 得 到 的 神经 网 络 ， 其 识别 的 错误 如 表 
5-1 所 示 ， 总 共 99 个 不 同 角 上 度 哲 摄 的 样本 中 识别 错误 个 数 为 7 个， 错误 率 7.07%， 即 正确 率 
为 92.93%。 


) 























表 5-1 第 一 个 弱 分 类 器 识别 错误 数 和 误差 率 





第 一 个 弱 分 类 器 分 类 误差 率 


7.07% 





(2) EH BEM RIAR 
在 使 用 5.4.3 小 节 的 程序 进行 目 适 应 增强 之 后 ， 得 到 的 输出 如 下 。 























kkk1 = 2 
= 2 
kkk3 = 1 
"B ASA OSAHYAR BATRE BANAR A 
2 2 1 5 
统计 弱 分 类 器 分 类 效果 
error] = 





构成 强 分 类 器 的 10 个 弱 分 类 器 总 的 识别 错误 数 和 误差 率 如 表 5-2 所 示 。 最 终 得 到 的 强 
分 类 器 错误 数 和 误差 率 如 表 5-3 所 示 。 


表 5-2 10 个 BP 神 经 网 络 弱 分 类 器 识别 错误 数 和 总 误差 率 








7.37% 
表 5-3 强 分 类 器 识别 错误 数 和 误差 率 
错误 类 型 强 分 类 器 分 类 误差 率 
错误 个 数 5.0596 





将 表 5-2 和 表 5-3 中 的 数据 进行 分 机 和 对 比 ， 可 发 现 10 个 弱 分 类 器 的 平均 分 类 误差 率 
高 于 强 分 类 器 的 分 类 误差 率 ， 说 明 单一 神经 网 络 弱 分 类 器 的 识别 效果 不 如 采用 由 多 个 网 络 组 
成 的 强 分 类 副 的 识别 效果 。 之 所 以 会 产生 这 样 的 又 距 ， 是 由 于 强 分 类 器 能 够 通过 每 个 网 络 训 
练 时 的 错误 调整 权重 ， 增 强 有 助 于 识别 正确 的 特征 ， 削 弱 无 用 特征 ， 从 而 提高 整体 的 识别 正 
人 确 率 。 

K 5-4 总 结 了 几 种 方法 的 识别 正确 率 ， 从 中 可 以 发 现 强 分 类 圳 的 实验 结 末 表现 出 了 很 高 
的 正确 率 ， 说 明 本 文 提 出 的 基于 仿真 模型 的 神经 网 络 三 维 目标 识别 方法 是 可 行 的 。 通 过 大 量 
实验 上 发现， 如 果 目 标 出 现在 采样 点 之 外 的 角度 可 能 造成 识别 的 不 稳定 ， 但 是 这 种 情况 随 用 有 
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样 间 隔 的 减 小 而 逐渐 减少 。 


表 5-4 强 弱 分 类 器 识别 正确 率 对 比 


方 法 弱 分 类 器 平均 正确 率 Wh 4) DR x 
正确 率 92.6396 94.95% 


WLRU, H ADUE KRH RIAR AL Ja Bé dede ra NAR EMR, AHAB 
所 述 方法 能 够 有 效 提 高 神经 网 络 三 维 目标 识别 的 正确 率 。 

在 强 分 类 邵 神 经 网 络 构建 中 ， 首 先 选 择 BP 神经 网 络 作为 弱 分 类 器 ， 然 后 根据 每 次 训练 
集 之 中 每 个 样本 分 类 的 正确 性 ， 以 及 上 次 的 总 体 分 类 的 准确 率 ， 来 确定 每 个 样本 的 权 值 ， 再 
将 修改 过 权 值 的 新 数据 集 送 给 下 层 分 关 喜 进行 训练 ， 最 后 将 每 次 训练 得 到 的 分 类 融融 合 起 
来 ， 作 为 最 后 的 决策 分 类 器 使 用 。 实 验 结果 表明 ， 及 用 强 分 类 右 进 行 的 识别 正确 紊 比 罚 分 类 
a WORT ES IE WARE i o 





























一 下 一 下 一 一 下 一 En aaa 站 


"m —" 
| ”经 验 分 享 : 神经 网 络 参数 的 选取 
| 在 使 用 神经 网 络 进行 目标 识别 时 ， 面 临 的 一 大 问题 就 是 神经 网 络 结构 的 确定 。 由 于 输 
i 入 层 和 输出 层 的 神经 元 个 数 由 具体 的 输入 输出 决定 ， 所 以 神经 网 络 具 体 结构 的 选择 ， 主 要 
是 指 对 于 隐 含 层 数 目 和 对 应 神经 元 个 数 的 选择 。 但 是 目前 尚 没有 十 分 准确 的 推导 方法 来 确 
j 定 应 该 用 多 少 层 隐 含 层 以 及 各 自 的 神经 元 个 数 ， 常 用 的 方法 一 般 是 经 验 公式 或 者 试 凑 法 . 
| 需要 注意 的 是 ， 隐 含 层 和 神经 元 并 不 是 越 多 越 好 ， 当 然 也 不 是 越 少 越 好 ， 神 经 元 个 数 过 多 
i 或 过 少将 会 分 别 导致 网 络 归纳 能 力 不 足 或 学 习 能 力 不 足 。 所 以 ， 应 当 兼顾 归纳 能 力 和 学 习 
1 能 力 ， 选 取 一 个 合适 的 值 ， 


经 验 公 式 方法 是 一 种 普通 归纳 出 来 的 方法 ， 主 要 应 用 于 单 隐 含 层 网 络 隐 含 层 神经 元 个 数 
的 确定 。 该 方法 通过 下 面 的 经 验 公 式 确定 : 

n =vJn+m+a 

n 为 输入 层 神经 元 数 ，m 为 输出 层 神经 元 数 ，ni 为 隐 含 层 神经 元 个 数 ，a 为 1 一 10 之 间 
的 整数 。 

试 凑 方法 是 对 于 给 定 的 输入 输出 摸 式 ， 通 过 反复 调试 得 到 合适 的 隐 含 层 神经 元 的 值 。 比 
如 ， 尝 试 将 隐 含 层 神经 元 个 数 分 别 设 为 10、20、30 个 ， 若 10 个 和 30 个 时 识别 正确 率 都 不 
如 20 个 时 高 ， 则 选择 20 附近 的 数 作为 实际 使 用 的 个 数 。 

本 书 中 先 用 经 验 公 式 计 算出 隐 含 层 神经 元 个 数 的 范围 ， 再 在 此 基础 上 做 一 定 的 调整 ， 找 
出 效果 好 的 个 数 。 
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第 6 章 实战 案例 详解 


本 章 导 读 


到 现在 为 止 ， 读 者 已 经 从 “数字 图 像 基 础 ”、“ 数 字 图 像 分 析 ”、“ 图 像 特征 提取 ”每 
儿 个 方面 对 现代 数字 图 像 处 理 技术 有 了 一 个 全 面 而 系统 的 了 解 。 俗 话说 ， 实 践 出 真知 。 本 章 
准备 了 数字 图像 在 测绘 领域 、 信 息 安 全 领域 、 多 媒体 通信 领域、 安 仿 领域 和 交通 领域 的 5 个 
典型 应 用 实例 来 帮助 读者 进一步 提高 。 


6.1 测绘 领域 的 应 用 : 基于 SURF 的 图 像 拼接 


研究 图 像 拼 接 的 意义 


数字 成 像 设 备 《〈 数 码 相 机 、 数 码 摄 像 机 等 ) 的 普及 使 得 数码 图 像 得 到 了 越 来 越 广 
泛 的 应 用 。 在 实际 的 科学 研究 和 工程 项 目 中 ， 经 单 会 用 到 超过 人 有 眼 视角 的 超 宽 视 角 和 多 
像 。 由 于 距离 的 限制 ， 普 通 数 码 相 机 的 视角 往往 不 能 满足 需要 ， 菏 些 超 大 尺寸 的 物体 
无 法 用 一 张 照 厂 拍 摄 下 来 。 为 了 得 到 大 视角 的 高 分 辨 这 图 像 ， 人 们 往往 利用 广角 镜 尖 
来 解决 这 一 问题 。 然 而 ， 在 一 些 特殊 环境 下 ， 设 备 本 喘 的 限制 使 得 数 季 图 像 和 视频 的 
视 场 宽度 不 能 满足 应 用 要 求 ， 如 利用 广角 镜头 虽然 也 可 得 到 宽 视 角 的 图 像 ， 但 广角 镜 
头 的 边缘 会 产生 难以 避免 的 扭曲 变形 ， 而 且 像 广角 镜头 这 样 的 特殊 设备 往往 价格 时 
$i, PEH D H WU. 

随 看 计算 机 和 图 像 处 理 技术 的 发 展 ， 图 像 拼接 搁 术 为 得 到 超 客 视角 图 像 提 供 了 很 好 的 解 
决 方案 。 它 可 将 一 系列 有 重 登 边界 的 普通 图 像 或 视频 图 像 进行 无 缝 拼接， 从 而 得 到 超 宽 视角 
图 像 。 图 像 拼 接 技术 的 出 现 使 采集 图 像 的 设备 更 普通 化 ， 利 用 普通 的 数码 照相 机 即 可 得 到 满 
足 要 求 的 图 像 。 

本 节 采 用 基于 快速 鲁 棒 特 征 点 〈Speeded Up Robust Features, SURF) 的 图 像 拼接 技术 ， 
该 扩 术 与 其 他 图 像 拼 接 技术 《如 基于 相位 相关 的 图 像 拼 接 ) 技术 相 比 ， 具 有 息 棒 性 好 的 特 
点 ， 对 图 像 序列 中 的 苍 照 变化 、 斥 度 变 化 、 旋 转变 化 具有 良好 的 适应 性 ; 与 基于 SIFT 特征 
点 的 网 像 拼接 技术 相 比 ， 其 拼接 速度 更 快 。 


6.1.2 基本 原理 及 实现 步骤 


IET SURF 的 图 像 拼接 扩 术 包括 三 大 部 分 : 特征 点 提取 与 匹配 、 网 像 配 准 、 疼 像 合成 。 

(1) 特征 点 的 提取 渎 匹配 

为 了 使 拼接 具有 良好 的 精度 和 惫 棒 性 ， 同 时 又 使 其 具有 较 好 的 实时 性 ， 本 市 采用 2008 
年 Bay 等 人 提出 的 SURF 算法 完成 图 像 序 列 特征 点 的 提取 。 

SURF 算法 又 称快 速 鲁 棒 特 征 ， 借 鉴 了 SIFT 中 简化 近似 的 思想 ， 将 DoH 中 的 高 斯 二 阶 













































































微分 模板 进行 了 近似 简化 ， 使 得 模板 对 图 像 的 滤波 只 需要 进行 几 个 人 简单 的 加 减法 运算 ， 并 日 
这 种 运算 与 滤波 模板 的 尺寸 无 关 。 实 验证 明 ，SUREF 算法 较 SIFT 在 运算 速度 上 要 快 3 倍 左 
石 ， 综 合 性 能 要 优 于 SIFT 算法 。 

SURF 特征 点 提取 与 描述 主要 包含 4 个 步骤 : 

1) 检测 尺度 空间 极 值 。 

2) 精炼 特征 点 位 置 。 

3) 计算 特征 点 的 摘 述 信息 。 

4) 生成 描述 特征 点 的 特征 同 量 。 

SURF 的 匹配 算法 是 通过 计算 两 个 特征 点 描述 算 子 之 间 的 欧 氏 距离 得 到 的 ， 即 找 出 与 
特征 点 描述 符 疡 欧 氏 距离 最 近 和 次 近 的 两 个 邻居 特征 点 来 描述 符 g9 和 9 ， 然 后 计算 p; 与 
q; 以 及 p, 5 q 两 组 描述 符 之 间 欧 氏 距 离 的 比值 ro WREE r nq UE BTE QULA y VU RO 
成 功 ，(P ,9g，) 点 对 则 为 图 像 序列 中 的 一 对 匹配 点 ， 和 否则 匹配 失败 。 这 种 匹配 方法 简便 快 
捷 ， 但 会 产生 误 瑟 配 。 针 对 上 述 了 问题 ， 本 节 采 用 引导 互 匹 配 和 投票 过 滤 两 种 技术 来 提高 匹 
配 精 度 。 

O 引导 互 匹配 法 : 该 方法 的 思想 是 缩小 特征 点 搜索 范围 ， 并 采用 互 映 射 的 方法 减少 错 
误 匹 配 。 假 设 图 像 变换 矩阵 的 当前 估计 为 五 ， 根 据 对 极 儿 何 特 性 ， 石 规定 了 第 一 幅 图 像 中 的 
点 x 在 第 二 幅 图 像 中 对 极 线 Hx 周围 的 搜索 范围 。 因 此 ， 应 在 第 二 幅 图 像 的 对 极 线 Hx 周 
图 的 一 定 区 域内 搜索 点 x 的 匹配 点 。 上 此外， 根据 互 映 射 原 理 ， 即 匹配 点 对 之 间 的 映射 关系 的 
对 称 性 ， 对 于 匹配 点 对 {1P 仿 9， 在 进行 死 配 映射 时 ， 应 存在 这 两 点 间 的 对 应 关系 
{P >q 和 {p,<-g,}。 因 此 ， 最 终 的 匹配 结果 可 表示 为 ， (第 一 幅 图 像 与 第 二 幅 图 像 进行 引 
导 [ 罗 配 的 结果 ) 首 (第 二 幅 图 像 与 第 一 幅 图 像 进行 引导 还 配 的 结果 )。 

D 投票 过 滤 法 : 使 用 投票 过 滤 法 消除 误 匹 配 的 理论 依据 如 下 : 在 两 幅 相 关 的 图 像 序 
列 中 ， 相 机 的 旋转 和 尺度 变化 均 相 对 稳定 ， 因 此 连接 图 像 中 各 组 匹配 点 对 所 形成 的 问 量 
之 间 的 偏差 应 符合 某 一 规律 。 如 图 6-1 所 示 ， 假 设 图 像 1 中 的 特征 点 p, 和 p, 分 别 与 图 像 
2 中 的 特征 点 9 和 9 相对 应 ， 即 (p, a; S (p; q;) 7E IE RS BU UG BO rop, Hu [6] e 
Ei-q;-p,E Ej-q; -p, ARAA EHR EKEMT H) ATERS FEANN MAR, BH 
Seih ds BRIE drm A UU BO AT RAAE E A RFE, H N 2 BUSSE y H 
HIERE VU E ARE o Aa WE BRIT AI A rp RE AAA ER E B3 Z5 E by EEUU RO RE TH 25 x a HP] 
匹配 点 对 。 即 采用 删除 横 纵 坐标 之 差距 离 平 均值 太 远 的 错误 匹配 点 对 的 投票 过 滤 方 法 来 
提高 匹配 精度 。 
















































































图 6-1 清除 误 匹 配 
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(2) 图 像 配 准 

图 像 配 准 是 一 种 确定 待 拼接 图 像 间 的 重 呈 区域 以 及 重 苹 位 置 的 技术 ， 它 是 整个 图 像 拼 接 
的 核心 。 本 节 采 用 的 是 基于 特征 点 的 图 像 配 准 方法 ， 即 通过 匹配 点 对 构建 图 像 序列 之 间 的 变 
换 和 矩阵 ， 从 而 完成 全 景 图 像 的 拼接 。 

变换 矩阵 五 求解 是 图 像 配 准 的 核心 ， 其 求解 的 算法 流程 如 下 。 

1) 检测 每 幅 图 像 中 特征 点 。 

2) 计算 特征 点 之 间 的 匹配 。 

3) 计算 网 像 间 变 换 矩 阵 的 初始 值 。 

4) RIEKE H PERSA EE, 

5) 引导 匹配 。 用 估计 的 五 去 定义 对 极 线 附近 的 搜索 区 域 ， 进 一 步 确 定 特 征 点 的 对 























6) ERRA) 和 5) 直到 对 应 点 的 数目 稳定 为 止 。 
设 图 像 序 列 之 则 的 变换 为 投影 变换 
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AF, H BEHEXO S8. X p-Gu.y). q-q(x,y) 是 匹配 的 特征 点 对 ， 则 根据 投影 变 


换 公 式 
h h hx 
=| h, h, hoy 
h h l1A1 


可 用 4 组 最 佳 匹 配 计算 出 五 矩阵 的 8 个 自由 度 参数 户 =( i=0,1,… ,7)， 并 以 此 作为 初始 
值 。 

为 了 提高 图 像 配 准 的 精度 ， 本 节 采 用 RANSAC 算法 对 图 像 变换 矩阵 进行 求解 与 精炼， 
达到 了 较 好 的 图 像 拼接 效果 。RANSAC 算法 的 基本 原理 可 通过 图 6-2 来 描述 。 

图 6-2a 中 总 共有 7 个 点 ， 其 中 有 6 个 点 属于 内 点 (正确 点 ) ， 而 第 7 个 点 属于 外 点 
( 偏 移 点 ) 。 此 时 用 最 小 二 乘法 拟 合 这 组 数据 ， 得 到 的 直线 如 图 中 虚线 所 示 ， 显 然 这 是 错误 
的 ， 此 时 实际 的 最 佳 拟 合 直线 应 该 是 那 条 穿越 了 前 6 个 点 的 黑色 实 线 。 

RANSAC 算法 的 思想 简单 而 巧妙 ， 首先 随机 地 选择 两 个 点 ， 这 两 个 点 确定 了 一 条 直 
线 ， 并 且 称 在 这 条 直线 的 一 定 范围 内 的 点 为 这 条 直线 的 支撑 。 这 样 的 随机 选择 重复 数 次 ， 然 
后 ， 具 有 最 大 支撑 集 的 直线 被 确认 为 是 样本 点 集 的 拟 合 。 在 拟 合 的 误差 距离 范围 内 的 点 被 认 
为 是 内 点 ， 它 们 构成 一 致 集 ， 反 之 则 为 外 点 。 根 据 算 法 描述 ， 可 以 很 快 判断 ， 如 果 只 有 少量 
外 点 ， 那 么 随机 选取 的 包含 外 点 的 初始 点 集 确定 的 直线 不 会 获得 很 大 的 支撑 ， 如 图 6-2b 所 
示 。 在 图 6-2a 的 例子 中 ， 经 过 RANSAC 算法 后 ， 点 7 就 会 被 剔除 掉 。 然 后 再 使 用 剩余 的 6 
个 点 进行 最 小 二 乘 拟 合 ， 就 会 得 到 接近 理想 解 的 直线 。 值 得 注意 的 是 ， 过 大 比例 的 外 点 将 导 
St RANSAC 算法 失败 。 在 直线 拟 合 的 例子 中 ， 由 点 集 确 定 直线 至 少 需要 两 个 点 ， 而 对 于 透 
视 变换 ， 这 样 的 最 小 集合 需要 有 4 个 点 。 
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图 6-2 RANSAC 算法 原理 解释 图 


(3) 图 像 合成 

根据 图 像 间 变换 矩阵 有 万， 可 以 对 相应 图 像 进 行 变换 以 确定 图 像 间 的 重 共 区 域 ， 并 将 待 融 
和 网 像 映射 到 到 一 幅 新 的 空白 图 像 中 形成 拼接 网 。 需 要 注意 的 是 ， 由 于 普通 的 相机 在 拍摄 照 
片 时 会 自动 选取 曝光 参数 ， 这 会 使 输入 图 像 间 存在 亮度 差异 ， 导 致 拼接 后 的 图 像 缝 合 线 两 站 
出 现 明显 的 明暗 变化 。 因 此 ， 在 融和 过 程 中 需要 对 缝合 线 进 行 处 理 。 进 行 图 像 拼 接 缝合 线 处 
理 的 方法 有 很 多 种 ， 如 颜色 插值 和 多 分 辩 率 样 条 技术 等 ， 本 节 采 用 了 快速 简单 的 加 权 平 滑 算 
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法 处 理 拼 接 颖 问题 。 该 算法 的 主要 思想 是 : 网 像 重 登 区 域 中 像素 点 的 灰 度 值 Pixel 由 两 幅 图 
像 中 对 应 点 的 灰 度 值 Pixel L 和 Pixel R 加 权 平 均 得 到 ， 即 Pixel-kx Pixel L+(1-k)x 
Pixel R, HF} k 是 可 调 因子 。 图 6-3 为 加 权 平 滑 算法 图 。 











拼接 图 像 





图 6-3 ”加权 平滑 算法 
通常 情况 下 0<k<1， 即 在 重 革 区域 中 ， 沿 图 像 1 问 图 像 2 IJ mm. kg 1 渐变 为 
0， 从 而 实现 重 半 区域 的 平滑 拼接 。 为 使 图 像 重 膨 区 域 中 的 点 与 两 幅 图 像 建 并 更 大 的 相 
天 性 ， 令 k-dl/(dlead2), $} dl, d2 分 别 表 示 重 登 区域 中 的 点 到 两 幅 图 像 重 登 区 域 的 左 
边界 和 右边 界 的 距离 。 即 使 用 公式 Pixel = -Pixel _L+ ei xPixel R t47 
r£ Nb THE, 


DNE cuts 

基于 快速 鲁 棒 特征 点 (SURE) 的 图 像 拼 接 技术 的 MATLAB 实现 代码 如 例 程 6-1— 6-7 
所 示 。 

例 程 6-1: 主 函 数 
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clear 
close all 
f= EI 


ext = 'jpg'; 


9696 谈 入 行 拼 接 的 图 像 
imgl = imread(hall1.jpg); 
imgl = rgb2gray(imgl); 
img2 = imread('halD2.jpg); 
img2 = rgb2gray(img2); 


%% 对 图 像 进行 拼接 ， 并 显示 、 生 成 拼接 后 的 图 像 

Img0 = imMosaic(img2,img1,1); 

figure,imshow(img0) 

imwrite(imgO,['mosaic 'f'.'ext],ext) 
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例 程 6-2: imMosaic 函数 
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POF 





function [ imgout | = imMosaic( img1,img2,adjColor ) 

% Dfe: 实现 图 像 拼 接 

% 输入 : img1, img2- 竺 拼接 的 灰 度 图 像 ， . 

% adjColor- 如 何 将 其 设置 为 1， 则 在 进行 拼接 时 将 会 目 动 对 灰 度 进行 调整 S 





%% 用 SURF 算法 选择 两 幅 图 像 的 对 应 扣 
[matchLocl matchLoc2] = surfMatch(imgl, img2); 


%% 用 RANSAC 算法 计算 变换 矩阵 H 

[H corrPtIdx] = findHomography(matchLoc2',matchLoc1); 
H *edith Ae H 

tform = maketform('projective', H’; 

img21 = imtransform(img2,tform); % 对 img2 进行 变换 


%% 对 灰 度 图 像 进行 调整 
[M1 NI dim] = size(imgl); 
[M2 N2 ~] = size(1mg2); 
if exist('adjColor','var) && adjColor == 
radius = 2; 
xlctrl = matchLocl(corrPtIdx, 1); 
ylctrl = matchLocl(corrPtIdx,2); 
x2ctrl = matchLoc2(corrPtIdx, 1); 
y2ctrl = matchLoc2(corrPtIdx,2); 
ctrlLen = length(corrPtIdx); 
s] = zeros(l,ctrILen); 
s2 = zeros(l,ctrlLen); 
for color = 1:dim 
for p = 1:ctrlLen 
left = round(max(1,x1ctrl(p)-radius)); 
right = round(min(N1,left+radius+1)); 
up = round(max(1,ylctrl(p)-radius)); 
down = round(min(M1,up+radius+1)); 
sl(p) = sum(sum(imgl(up:down,left:right,color))); 
end 
for p = I:ctriLen 
left = round(max(1,x2ctrl(p)-radius)); 
right = round(min(N2,left*radius*1)); 
up = round(max( 1,y2ctrl(p)-radius)); 
down = round(min(M2,up-radius-1)); 
s2(p) = sum(sum(img2(up:down,left:right,color))); 
end 
sc = (radius*24-1)^2*ctrlLen; 
adjcoef = polyfit(s1/sc,s2/sc,1); 
imgl(:,:,color) = imgl(:,:,color)*adjcoef( 1)*-adjcoef(2); 
end 
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end 


%% ”进行 拼接 

pt = zeros(3,4); 

pt(,1) = H*[1;1;1]; 
pt(:,2) = H*[N2;1;1]; 
pt(:,3) = H*[N2;M2;1]; 
pt(:,4) = H*[1;M2;1]; 
x2 = pt(1,:)./pt(3,:); 

y2 = pt(2,:)./pt(3,:); 


up = round(min(y2)); 
Yoffset = 0; 
if up <= 0 
Yoffset = -up+1; 
up= l; 


end 


left = round(min(x2)); 
Xoffset = 0; 
if left<=0 
Xoffset = -left+1; 
left = 1; 


end 


[M3 N3 ~] = size(img21); 
imgout(up:up-M3- 1 left:left--N3-1,:) = img21; 
imgout(Yoffset-1:Yoffset-M1,Xoffset-1:Xoffset--N1,:) = imgl; 


end 
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例 程 6-3: surfMatch 函数 





obLbELLLLLLLLLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL 


function [matchLocl matchLoc2] = surfMatch(imgl, img2) 
o 功能: 提取 街 拼接 图 像 的 特征 点 

%  'AX:imgl, img2- 答 拼接 的 灰 度 图 像 ; 

% 输出: matchLocl-imgl 中 特征 点 的 位 置 ; 

% matchLoc2-img2 中 特征 点 的 位 置 ; 


X 


%% A EHI SURF RIE 
points] = detectSURFFeatures(imgl); 
points2 — detectSURFFeatures(img2); 
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%% ”提取 两 幅 图 像 的 SURF 特征 点 的 特征 向 量 
[fl, vpts1] = extractFeatures(imgl, points1); 
[f2, vpts2] = extractFeatures(img2, points2); 





%% ”匹配 特征 向量 D 


index pairs = matchFeatures(fl, f2) ; 


%% ”显示 匹配 后 特征 点 的 位 置 
matched ptsl = vptsl(index pairs(:, 1)); 
matched pts2 = vpts2(index pairs(:, 2)); 
matchLocl = matched pts1.Location; 


matchLoc2 = matched pts2.Location; 
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例 程 6-4: findHomography 函数 


炒米 米 米 米 米 炒米 米 米 米 米 炒米 米 米 米 米 米 米 米 米 米 米 米 米 炒米 米 米 米 炒米 米 米 米 米 炒米 米 米 米 米 米 米 炒米 米 米 米 米 炒米 米 米 米 米 炒米 米 米 炒米 炒米 米 米 米 米 


function [H corrPtIdx] = findHomography(pts1,pts2) 

% 功能 : 采用 RANSAC 算法 计算 变换 矩阵 H; 

Vo ”输入 : ptsl,pts2- 两 幅 图 像 中 匹配 特征 点 的 坐标 
% 输出: HERE E 


Uo | corrPtlIdx is the indices of inliers. 


coef.minPtNum - 4; 

coef.iterNum = 30; 

coef.thDist — 4; 

coef.thInlrRatio = .1; 

[H corrPtIdx] = ransacl(pts1,pts2,coef,(Q)solveHomo,(Q)calcDist); 


end 


function d = calcDist(H,pts],pts2) 

% ”功能 : 根据 变换 矩阵 ， 将 ptsl 映射 为 pts3， 然 后 计算 pts3 与 pts2 的 距离 ; 
Vo ”输入 : pts1,pts2- 两 幅 图 像 中 匹配 特征 点 的 坐标 ; 

% HÆ HAERE; 

% 输出: d- 距 离 值 。 





n = size(pts1,2); 

pts3 = H*[pts1;ones(1,n)]; 

pts3 = pts3(1:2,:)/repmat(pts3(3,:),2,1); 
d = sum((pts2-pts3).^2,1); 


end 
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例 程 6-5: solveHomo 函数 


obEbELLLLLLLLLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL 


function H = solveHomo(pts1 ,pts2) 

% De: 通过 ptsl 和 pts2 计算 变换 矩阵 H 

Vo ”输入 : ptsl,pts2- 两 幅 图 像 中 匹配 特征 点 的 坐标 ; 
% 输出 : HAERA 


n = size(pts1,2); 

A — zeros(2*n,9); 
A(1:2:2*n,1:2) = pts1'; 
A(1:2:2*n,3) = 1; 
A(2:2:2*n,4:5) = pts1'; 
A(2:2:2*n,6) = 1; 

xl = pts1(1,:)'; 

yl = pts1(2,:)'; 

x2 = pts2(1,:)'; 

y2 7 pts2Q2,:); 
À(1:2:2*n,7) = -x2.*x1; 
A(2:2:2*n,7) = -y2.*x1; 
A(1:2:2*n,8) = -x2.*y1; 
A(2:2:2*n,8) = -y2.*y1; 
A(1:2:2*n,9) = -x2; 
A(2:2:2*n,9) = -y2; 


[evec,~] = eig( A'* A); 
H = reshape(evec(:,1),[3,3])'; 
H = H/H(end); 


end 
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例 程 6-6: ransac1 函数 


obEbELLLLELLLELLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL 


function [f inlierIdx] = ransacl( x,y,ransacCoef,funcFindF,funcDist ) 
% 功能 : 实现 RANSAC 算法 


minPtNum = ransacCoef.minPtNum; 
iterNum = ransacCoef.iterNum; 
thInlrRatio = ransacCoef.thInlrRatio; 
thDist = ransacCoef.thDist; 

ptNum = size(x,2); 

thInlr ^ round(thInlrRatio*ptNum); 


inlrNum = zeros(1,iterNum); 
fLib = cell(1,iterNum); 
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for p = 1:iterNum 
%1. 采用 随机 点 进行 拟 合 
sampleldx = randIndex(ptNum,minPtNum); | 
fl = funcFindF(x(:,sampleIdx),y(:,sampleIdx)); D 


%2. 对 内 点 进行 计数 

dist = funcDist(f1,x,y); 

inlier1 = find(dist < thDist); 

inlrNum(p) = length(inlierl); 

if length(inlier1) < thInlr, continue; end 

fLib{p} = funcFindF(x(:,inlierl),y(:,inlierl)); 
end 


% 3. 人 确定 拟 合 系数 

[~,idx| = max(inlrNum); 

f= fLib(idx); 

dist = funcDist(f,x, y); 
inlierIdx = find(dist < thDist); 


end 
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例 程 6-7: randlndex 函数 
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function index = randIndex(maxIndex,len) 


% 功能 : 从 整数 1: MAXINDEX 随机 、 不 重复 地 选择 LEN 


if len > maxIndex 
index - []; 
return 


end 


index — zeros(1,len); 
available = 1:maxIndex; 
rs = ceil(rand(1,len).*(maxIndex:-1:maxIndex-len-1)); 
for p = I:len 

while rs(p) == 

rs(p) = ceil(rand(1)*(maxIndex-p-*1)); 

end 

index(p) = available(rs(p)); 

available(rs(p)) = |]; 


end 
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例 程 6-1 一 例 程 6-7 的 运行 效果 如 图 6-4 所 示 。 
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图 6-4 两 幅 图 像 的 拼接 效 未 
a) 输入 的 待 拼接 的 两 幅 图 像 b) 拼接 后 的 效果 





3 测 卫 下 天际 中 需要 注意 的 问题 





在 实际 应 用 中 发 现 对 于 两 幅 光 照 或 色彩 强度 差异 较 大 的 图 像 ， 仅 仅 消 除 可 见 拼 接 缝 是 不 
够 的 。 使 用 上 述 多 分 辨 率 法 消除 可 见 拼 接 缝 后 ， 还 是 会 有 明显 的 过 小 市 现象 ， 而 且 拼接 网 像 
看 起 来 也 不 真实 。 

图 6-5 是 两 幅 网 像 生 接 重 合 拼接 后 的 结 来 ， 可 见 右上 方 的 几 像 明显 比 堪 下 方 的 图 像 晤 很 
多 。 这 是 因为 在 拍摄 时 照相 机 采用 目 动 快门 方式 ， 天 空 的 区 强 要 比 场 景 中 物体 的 区 强 腕 很 
多 ， 照 相机 为 了 对 天 衬 正 确 曝光 采取 了 较 高 的 快门 速度 ， 导 致 下 方 的 楼 房 和 房 顶 担 得 很 墨 。 
这 样 的 两 幅 图 像 拼 接 在 一 起 后 目 然 会 出 现 可 见 的 拼接 颖 。 


























图 6-5 Pla ELBORIHEPRBEHITI AG 


图 6-6 说 明了 图 6-5 "Pha RUE CER PEBUATIT] C7; Fio. HUER ENKAN KA 
FIRK. MRAR BRAAK, WETERE PSCBUTS] PEERS ECT ELTE ASH IR] « 
AE SE. npELSIdX RS pour P PEE TRI ELO ELS AR PAESE ARRAS EARS IT 
那 幅 图 像 ， 使 两 幅 图 像 光 照 在 同一 水 平 上 。 
































Kl6-6 重 登 部 分 图 像 和 和 直方 网 
a) 图 6-5 无 下 方 图 像 及 直方 图 b) 图 6-5 右上 方 图 像 及 直方 图 
对 像素 值 的 调整 可 以 表示 为 使 用 一 个 函数 对 像素 值 进行 映射 ， 如 : 
I'(x, y) 2 f (16. y)) 
KA 0O PEER, fBiEHUIEAHIEUÉXZR. mK 6-7 所 示 ， 横 癌 的 灰 度 条 表 











示 输 入 像 系 值 ， 纵 问 的 灰 度 条 表示 输出 的 像素 值 ， 通 过 调整 儿 6-7 中 的 函数 曲线 ， 图 像 中 上 暗 
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0 ”输入 灰 座 255 
————— 


图 6-7 BREKI H 
重 登 区 域 中 图 像 的 直方 图 说 明了 像素 值 出 现 的 频率 ， 把 每 个 频率 除 以 这 个 区 域 的 总 像素 
数 束 得 到 了 像 聚 值 出 现 的 概率 p(w) ， 从 而 得 到 像素 值 的 累积 分 布 函数 : 
CDF(r)- | p(w)dw 
图 6-8 男 出 了 图 6-5 中 两 幅 图 像 的 累积 分 布 国 数 曲线 ， 设 左下 图 像 为 参考 图 像 ， 右 上 和 图 
像 按 照 它 的 光照 进行 调整 ， 对 于 右上 图 像 的 每 一 个 像 妹 值 CO g < 255 ) ART RRI 
布下 对 应 的 左下 图 像 的 像素 值 。 例 如 ， 对 给 定 右 上 图 像 的 像素 值 g, ， 由 图 可 知 ， 有 
CDF(g,)= CDF(2;) 
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7 待 调整 曲线 


参考 曲线 





图 6-8 EAKIRH HI RIRI PRG 


所 以 对 右上 图 像 中 所 有 像素 值 为 g, 的 像素 都 需要 映射 为 像素 值 8 X 0 一 255 级 灰 度 都 
进行 这 样 的 操作 就 可 以 得 到 像素 值 映 射 曲 线 。 

最 终 得 到 的 函数 映射 曲线 如 图 6-9b 所 示 ， 这 里 分 别 对 RGB 三 色 进 行 映 射 ， 右 上 方 图 像 
在 重 登 区 域 的 部 分 经 过 曲线 映射 后 得 到 的 直方 铬 如 图 6-9c 所 示 ， 可 以 看 出 这 个 直方 图 已 经 




















和 图 6-6a 所 示 的 直方 图 相当 接近 。 如 来 只 需要 对 图 像 的 腕 度 进行 调整 ， 那 么 可 以 先 把 图 像 
转换 到 HSI 空间 ， 统 计 I 分 量 的 直方 图 ， 然 后 得 到 映 冉 曲线 。 
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图 6-9 ”经 映射 曲线 处 理 后 的 直方 图 
a) 图 6-5 中 左下 方 图 的 直方 图 b) 最 终 得 到 的 函数 映射 曲线 c) 图 6-5 中 右上 方 图 经 曲线 映射 后 的 直方 图 
最 后 ， 通 过 图 6-9b 的 映射 曲线 对 右上 图 像 全 图 的 每 一 个 像素 进行 映射 调整 ， 调 整 后 的 


图 像 再 与 左下 图 进行 拼接 ， 结 来 如 图 6-10 所 示 。 整 个 图 像 光照 均匀， 而 且 拼 接 颖 已经 不 可 
见 。 可 见 ， 光 照 平衡 和 拼接 颖 消除 搭配 使 用 能 获得 最 日 然 的 拼接 全 图 。 











图 6-10 全 图 色彩 校正 后 得 到 的 拼接 图 像 


62 ”信息 安全 领域 的 应 用 : 基于 小 波 变 换 的 数字 
水 印 技术 


EXB 数字 水 印 技术 


数字 水 印 〈Digital Watermarking) 是 一 种 十 分 有 效 的 新 型 数字 水 印 产 品 和 版 权 保护 和 数据 
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安全 维护 技术 ， 也 是 一 种 十 分 贴近 实际 应 用 的 信息 隐藏 技术 。 数 字 水 印 是 将 具有 特定 意义 的 
标记 《水 印 ) 利用 数字 移入 的 方法 隐藏 在 数字 图 像 、 声 首 、 文 档 、 图 书 、 视 频 等 数学 产品 
中 ， 用 以 证 明 创 作者 对 其 作品 的 所 有 权 ， 并 作为 鉴定 、 起 诉 非 法 侵权 的 证 据 ， 同 时 通过 对 水 
印 的 检测 和 分 析 ， 保 证 数字 信息 的 完整 可 靠 性 ， 从 而 成 为 知识 产权 保护 和 数字 多 媒体 防伪 的 
有 效 手 段 。 

数字 水 印 技术 是 信息 隐藏 领域 一 个 非常 重要 的 分 文 。 由 于 数字 图 像 很 容易 被 未 授权 的 用 
户 复制 ， 用 传统 的 密码 方法 也 不 能 很 好 地 解决 上 述 问题 ， 这 使 图 像 版 权 保 护 和 服务 认证 等 面 
临 日 益 严 峻 的 挑战 。 而 数学 水 印 技术 则 以 信号 处 理 的 方法 在 数学 化 的 图 像 数 据 中 舱 入 隐 舍 的 
版 权 标 识 ， 非 常 适 用 于 数字 图 像 的 版 权 保护 。 
能 入 数字 水 印 的 基本 原理 

从 图 像 处 理 的 角度 看 ， 磐 入 水 印 可 以 看 做 是 在 强 背 景 〈 原 始 图 像 ) 下 闭 加 一 个 弱 信 
号 《水 印 )， 由 于 人 的 视觉 系统 对 几 像 的 分 辨 率 有 限 ， 因 此 只 要 有 登 加 的 信号 在 幅度 上 低 
于 某 个 对 比 度 门限 ， 束 可 以 使 人 眼 完 全 感受 不 到 闭 加 信和 号 的 存在 ， 这 个 对 比 度 门限 主要 
受 系 统 的 空间 、 时 间 和 频率 特征 的 影响 。 因 此 ， 对 于 对 原始 图 像 做 一 定 的 调整 是 完全 有 
可 能 在 不 改变 视觉 效果 的 前 提 下 般 入 一 些 额 外 信息 的 。 数 宇 水 印 基 入 的 过 程 如 图 6-11 
所 示 。 






















































水 印信 息 


图 6-11 数 子 水 印 内 入 过 程 示意图 


[EXE 数字 水 印 的 特点 


(1) 管 棒 性 :图像 一 旦 租 入 了 水 印 后 ， 图 像 与 水 印 将 紧密 融合 在 一 起 ， 而 且 不 因 图 像 的 
茶 种 处 理 而 导致 隐 售 的 水 印信 息 丢 失 。 这 里 所 谓 的 “处 理 ”， 包 括 了 噪声 和 干扰、 滤波 、 平 
消 、 增 强 、 重 采样 、 有 损 编码 压缩 、D/A 或 A/D 转换 每 各 种 常规 的 图 像 处 理 手 段 。 图 像 水 印 
除了 能 对 无 意识 的 图 像 处 理 操作 具有 抵御 能 力 外 ， 还 具备 抵抗 恶意 删除 攻击 、 迷 惑 攻 击 等 有 
意识 攻击 的 能 力 ， 除 非 攻 击 方 对 加 入 的 水 印 有 足够 的 移 验 知识 ， 人 否则 任何 破坏 和 去 除 水 印 的 
企图 都 将 严重 损坏 图 像 的 男 质 ， 使 破解 后 的 网 像 坚 无 利用 价值 。 

(20 不 可 检测 性 : 水 印 和 网 像 应 具有 一 致 的 特性 ， 如 统计 噪声 分 布 等 ， 这 样 可 以 使 非法 
攻击 者 无 从 确认 该 图 像 是 否 含 有 水 印信 息 。 

G) 透明 性 : 此 特性 主要 应 用 了 人 了 眼 的 生理 特点 ， 经 过 隐藏 处 理 的 图 像 水 印 不 会 对 原始 
Fc UE ILDE n] 2 BE ua Jof PR ECL. o 


含水 印 图 像 
























































(4) 低 复 杂 性 :水印 的 柑 入 和 提取 识别 算法 应 简单 易 行 。 
(5) 自 恢复 性 ， 嵌入 了 水 印 的 图 像 在 经 过 一 系列 的 处 理 和 变换 后 ， 可 能 对 原 图 产生 了 较 





大 的 破坏 ， 这 就 要 求 从 留 下 的 片段 中 ， 仍 可 提取 出 水 印 或 水 印 残 厂 )， 并 根据 榨 验 出 的 结 
果 人 确认 出 水 印 的 存在 。 


[EE 基 于 小 波 变换 的 数字 水 印 戏 入 | 


小 波 变换 的 基本 原理 已 在 本 书 的 2.5 节 了 予以 论述 ， 现 将 基于 小 波 变 换 的 数字 水 印 姐 入 的 
步骤 总 结 如 下 。 

D 将 原始 图 像 和 水 印信 息 以 Double 类 型 的 形式 读 入 。 

2) 将 原始 彩色 图 像 分 解 为 3 个 基色 分 量 Cr 、Cg 、Cb， 分 别 对 该 三 个 基色 分 量 用 
Haar 小 波 基 进行 二 级 小 波 分 解 。 

3) 将 数字 水 印 同样 分 解 为 Cwr 、Cwg 、Cwb 三 个 基色 分 量 ， 分 别 对 其 进行 一 级 小 波 
分 解 。 

4) 将 数字 水 印 的 三 基色 分 解 系数 分 别 对 应 散 入 到 原始 彩色 图 像 的 三 基色 分 解 系数 中 ， 
BON AUN 












































Cr(G,B)A2(4, j) = CR(GB)A»(i, j)*r(g, b)* WR(GB)A1(1, j) 
Cr(G,B)HI(i, j) = CrR(G,B)H: (i, j)*r(g, b)* Wr(G,B)HI(i, j) 
Cr(G,B)V 1C, J) = Cr(G,B)VI(i, j)*r(g, bD)* Wer(G,B)VI(i, j) 
CR(GB)Di(, j) = CR(GB)Di(À, j)*r(g, b)* WR(G.B)Di1(À j) 
其 中 ，CrAs (i, 表示 骸 入 水 印 前 原始 图 像 的 红色 分 量 经 小 波 两 层 分 解 后 对 应 区 域 坐 标 
(i, 刀 处 的 小 波 系数 ，WRAIG, 让 表示 水 印信 息 的 红色 分 量 经 一 级 小 波 分 解 后 的 低频 区 域 中 举 标 
(ü j) 处 的 小 波 系 数 ; r 表示 红色 分 量 加 权 系 数 ;，CrAs (i 有 站 表示 骸 入 水 印信 息 后 的 红色 分 量 的 
小 波 系 数 ， 其 余 类 推 。 日 R、G、B 三 种 基色 分 量 加 权 系 数 满足 + : g : b=2 : 1 : 4 的 关系 。 























例 程 精 讲 
例 程 6-8 是 基于 小 波 变换 的 数字 水 印 嵌 入 的 MATLAB 程序 ， 其 运行 结果 如 图 6-12 
所 示 。 
例 程 6-8 
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function watermark 

clear all; 

cle; 

% 你 存 开始 时 间 

start time-cputime; 
figure(1); 

% 读 出 原始 图 像 
subplot(1,3,1); 
input-imread('hua61 .jpg^; 
imshow(input); 


title(' 原 始 图 像 ); 
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% 读 出 水 印 

subplot(1,3,2); 

water-imread('A.]pg); 

imshow(water,[]); 

title( 水 印 ); 

% 三 色 分 离 

input-double(input); 

water-double(water); 

inputr-input(:,:, 1); 

waterr-—water(:,:,1); 

inputg-input(:,:,2); 

waterg-water(:,:,2); 

inputb-double(input(:,:,3)); 

waterb-double(water(:,:,3)); 

% 系 数 z 大 .增加 得 棒 性 ,r 小 增加 透明 性 

r—0.06; 

97K EI R 的 分 解 

[Cwr,Swr|-WAVEDEC2(waterr, ,'haar'); 

% 图 像 R 的 分 解 

[Cr,Sr]>WAVEDEC2(inputr,2,'haar'); 

% 水 印 的 能 入 

Cr(1:size(Cwr,2)/16)-... 
Cr(1:size(Cwr,2)/16)*r* Cwr(1:size(Cwr,2)/16); 





k-0; 
while k«-size(Cr,2)/size(Cwr,2)-1 
Cr(1-9size(Cr,2)/4*k*size(Cwr,2)/4:size(Cr,2)/44... 
(k-1)*size(Cwr,2)/4)-Cr(1-size(Cr,2)/4--... 
k*size(Cwr,2)/4:size(Cr,2)/4--(k--1)*size(Cwr,2)/44... 
r*Cwr(1-size(Cwr,2)/4:size(Cwr,2)/2)); 
Cr(1-*size(Cr,2)/2*k*size(Cwr,2)/4:size(Cr,2)/24... 
(k-1)*size(Cwr,2)/4)-Cr(1-size(Cr,2)/2--... 
k*size(Cwr,2)/4:size(Cr,2)/2--(k-1)*size(Cwr,2)/44-... 
r*Cwr(1-*size(Cwr,2)/2:3*size(Cwr,2)/4)); 
Cr(143*size(Cr,2)/44-k*size(Cwr,2)/4:3*size(Cr,2)/44... 
(k*-1)*size(Cwr,2)/4)-Cr(1-43*size(Cr,2)/47-... 
k*size(Cwr,2)/4:3*size(Cr,2)/44-(k*-1)*size(Cwr,2)/44-... 
r*Cwr(143*size(Cwr,2)/4:size(Cwr,2))); 
k=k+1; 
end; 
Cr(1:size(Cwr,2)/4)=Cr(1 :size(Cwr,2)/4)+r*Cwr(1 :size(Cwr,2)/4; 
g=0.03; 
% 水 印 G 的 分 解 
[Cwg,Swg]=WAVEDEC2(waterg,1,'haar'); 
% 图 像 G 的 分 解 
[Cg,Sg]l-WAVEDEC2(inputg,2,'haar"); 
Ve7K ELITS] EKA 











#67 (CUDEQINL. 
Cg(1:size(Cwg,2)/16)-... 
Cg(1:size(Cwg,2)/16)*g* Cwg(1:size(Cwg,2)/16); 
k=0; 
while k«-size(Cg,2)/size(Cwg,2)-1 : 
Cg(1-size(Cg,2)/44k*size(Cwg,2)/4:size(Cg,2)/44-... 
(k--1)*size(Cwg,2)/4)-Cg(1-size(Cg,2)/4--... 
k*size(Cwg,2)/4:size(Cg,2)/4--(k*-1)*size(Cwg,2)/44... 
g*Cwge(l1-size(Cwg,2)/4:size(Cwg,2)/2)); 
Cg(1-size(Cg,2)/2*k*size(Cwg,2)/4:size(Cg,2)/24-... 
(k--1)*size(Cwg,2)/4)-Cg(1-size(Cg,2)/24... 
k*size(Cwg,2)/4:size(Cg,2)/2--(k*1)*size(Cwg,2)/44-... 
g*Cwg(1-size(Cwg,2)/2:3*size(Cwg,2)/4)); 
Cg(143*size(Cg,2)/4--k*size(Cwg,2)/4:3*size(Cg,2)/44... 
(k--1)*size(Cwg,2)/4)-Cg(1--3*size(Cg,2)/47... 
k*size(Cwg,2)/4:3*size(Cg,2)/4--(k--1)*size(Cwg,2)/44... 
g*Cwge(1-43*size(Cwg,2)/A:size(Cwg,2))); 
k=k+1; 
end; 
Cg(1:size((Cwg,2)/4)=Cg(1:size(Cwg,2)/4)+g*Cwg(1:size(Cwg,2)/4); 
b=0.12; 


% 水 印 B 的 分 解 
[Cwb,Swb]|-WAVEDEC2(waterb, 'haar'); 
ARR B 的 分 解 
[Cb,Sb]-WAVEDEC2(inputb,2,'haar"); 
Ve7K EN BJ Hi ANN 
Cb(1:size(Cwb,2)/16)-... 
Cb(1:size(Cwb,2)/16)*b*Cwb(1:size(Cwb,2)/16); 
k-0; 
while k«-size(Cb,2)/size(Cwb,2)-1 
Cb(1-size(Cb,2)/44k*size(Cwb,2)/4:size(Cb,2)/4--... 
(k-1)*size(Cwb,2)/4)-Cb(1-size(Cb,2)/4-... 
k*size(Cwb,2)/4:size(Cb,2)/4-(k*1)*size(Cwb,2)/44-... 
b*Cwb(1-size(Cwb,2)/4:size(Cwb,2)/2)); 
Cb(1-size(Cb,2)/24-k*size(Cwb,2)/4:size(Cb,2)/2^-... 
(k-1)*size(Cwb,2)/4)-Cb(1-size(Cb,2)/2-... 
k*size(Cwb,2)/4:size(Cb,2)/2-(k--1)*size(Cwb,2)/44-... 
b*Cwb(1-size(Cwb,2)/2:3*size(Cwb,2)/4)); 
Cb(143*size(Cb,2)/4—-k*size(Cwb,2)/4:3*size(Cb,2)/44-... 
(k-1)*size(Cwb,2)/4)-Cb(1--3*size(Cb,2)/4-... 
k*size(Cwb,2)/4:3*size(Cb,2)/4--(k--1)*size(Cwb,2)/4-... 
b*Cwb(1-43*size(Cwb,2)/4:size(Cwb,2))); 
k=k+1; 
end; 
Cb(1:size(Cwb,2)/4)=Cb(1:size(Cwb,2)/4)+b*Cwb(1:size(Cwb,2)/4); 
% 图 像 的 重 构 
inputr=WAVEREC2(Cr,Sr,'haar'’); 
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inputg=WAVEREC2(Cg,Sg,'haar'); 
inputb=WA VEREC2(Cb,Sb,'haar'); 
9o — C^ RS ER ITI 
temp-size(inputr); 
pic-zeros(temp(1),temp(2),3); 
for 1i-1:temp(1); 
for j-1:temp(2); 

pic(1,j, 1)-inputr(1,j); 

pic(1,,2)-inputg(1,j); 

pic(1,j,3)-inputb(i,); 

end; 

end; 
output-uint8(round(pic)); 
% 转 化 为 unit8 
watermarked image uint8=uint8(output); 
imwrite(watermarked image uint8,'watermarkedl.bmp','bmp); 
% 显 示 时 间 
elapsed time-cputime-start time, 
% 输 出 结果 
subplot(1,3,3); 
imshow(watermarked image uint8); 
title( 水 印 图 像 ); 


oLbLLLLLLLLLELLELLLLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLERLL 


原始 图 像 水 印 水 印 图 像 





图 6-12 例 程 6-8 的 运行 结 
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i 经 验 分 享 ， 影响 数字 水 印 性 能 的 因素 1 
| (D 说 入 信息 的 数量 : 谈 入 的 信息 量 越 多 ， 水 印 的 鲁 棒 性 就 越 低 。 i 
: (2) 水 印 详 入 强度 : 在 水 印 衣 入 强度 和 水 印 可 感知 性 之 间 有 一 个 均衡 。 高 鲁 棒 性 需要 | 
| 更 强 的 嵌入 ， ix Rd 4 来 增 大 了 水 印 的 可 感知 性 . : 
1 (2 图 像 数据 的 大 小 和 种 类 : 通常 图 像 数 据 的 尺寸 大 小 对 嵌入 水 印 的 鲁 棒 性 有 直 1 
+ 接 的 影响 。 : 
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63 ”多 媒体 通信 和 领域 的 应 用 : 基于 PIFS 分 形 压缩 
编码 技术 


6.3.1. 压缩 编码 概述 | 


言 轧 时 代 市 来 了 “信息 爆炸 ” 使 数据 量 大 增 ， 因 此 ， 无 论 传输 或 存储 都 需要 对 数据 进 
行 有 效 的 压缩 。 众 所 周知 ， 网 像 的 数据 量 非 常 大 ， 为 了 有 效 地 传输 和 存储 图 像 ， 有 必要 压缩 
图 像 的 数据 量 ， 而 且 随 着 现代 通信 技术 的 发 展 ， 要 求 传输 的 图 像 信 息 的 种 类 和 数据 量 越 来 越 
大 ， 奉 不 对 其 进行 数据 压缩 ， 便 难以 推广 应 用 。 

来 看 日 常生 活 中 的 一 个 例子 : 一 段 图 像 分 辩 率 为 640x480 的 32 位 色彩 视频 影像 ， 其 中 
一 幅 画 面 所 占 数 据 量 是 640x480x4， 约 二 1.2MB， 如 果 视 频 播 放 速 率 是 25 帧 /$， 则 每 秒 钟 的 
数据 量 是 30MB。 如 果 不 经 过 压缩 ， 那 么 一 张 650MB 的 光盘 只 能 放 21 秒 钟 的 内 容 ， 一 部 2 
个 小 时 的 电影 需要 300 多 张 光 盘 。 

从 压缩 的 客体 一 一 “数字 网 像 ” 来 看 ， 原 始 网 像 数 据 是 高 度 相 关 的 ， 存 在 很 大 的 元 余 。 
数据 元 余 造 成 比特 数 当 费 ， 消 除 这 些 元 余 可 以 节约 码 字 ， 也 束 是 达到 了 数据 压缩 的 目的 。 大 多 
数 图 像 内 相 邻 像素 之 则 有 较 大 的 相关 性 ， 称 之 为 空间 见 余 ; 序列 图 像 前 后 帧 内 相 令 之 间 有 较 大 
的 相关 性 ， 称 之 为 时 间 见 余 。 而 压 见 的 目的 就 是 尽 可 能 地 消除 这 些 见 余 。 图 像 的 规则 性 可 以 用 
图 像 的 目 相 关系 数 来 衡量 ， 图 像 越 有 规则 ， 其 日 相关 系数 越 大 ， 图 像 的 空间 见 余 束 越 大 。 

从 图 像 感知 的 主体 “人 的 视觉 系统 和 大 脑 ” 来 看 ， 有 些 图 像 信 息 〈 如 色 度 信息 、 高 
频 信 息 〉 在 通常 的 视觉 过 程 中 与 男 外 一 些 信息 相 比 来 说 不 那么 重要 ， 这 些 信息 可 以 认为 是 心 
里 视觉 见 余 ， 去 除 这 些 信息 并 不 会 明显 地 降低 人 了 眼 所 感受 到 的 图 像 质量 ， 因 此 在 压缩 的 过 程 
中 可 以 去 除 这 些 人 有 眼 不 敏感 的 信息 ， 从 而 实现 数据 压缩 。 


基于 PIFS 的 图 像 压缩 


实现 多 媒体 通信 的 关键 技术 之 一 是 图 像 压 缩 。 利 用 分 形 压 缩 图 像 ， 对 某 些 特殊 的 图 像 可 
获得 1000 多 倍 的 压缩 比 ， 分 形 压缩 上 共有 潜在 的 高 压缩 比 ， 因 此 分 形 压缩 是 当前 图 像 压 缩 的 







































































想 是 1987 年 Bamsley 首先 提出 的 ， 但 他 未 能 给 出 适用 于 所 有 图 像 的 自动 生成 变换 算法 ， 
他 的 学 生 Jacquin 在 1989 年 提出 了 一 种 基于 局 部 欠 代 函数 系统 (PIFS)， 可 以 真正 目 动 实现 
图 像 压 缩 的 算法 一 一 分 形 块 编码 。 在 此 基础 上 形成 了 分 形 编码 的 基本 算法 ， 相 比 于 以 前 人 机 
交互 的 编码 方式 ， 该 方法 第 一 次 真正 实现 了 分 形 编码 的 自动化， 但 该 方法 计算 量 大 、 复 光度 
高 。 比 例 因 子 是 编码 过 程 中 需要 计算 的 基本 量 。 

PIFS 编码 的 基本 步骤 如 下 。 

1) 分 块 。 假 设 原 图 像 为 4， 首 先 把 4 分 成 互 不 相交 的 、 尺 寸 大 小 为 2” x 2^ 的 值 域 块 
R,，i=1,2,…n ，i 代 表 值 域 块 的 编号 ， 且 有 | R= 4， 然 后 ， 在 4 中 选取 定义 块 D;, ME 
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义 块 刀 的 矿 寸 大 于 值 域 块 的 大 寸 ， 一 般 情 况 下 ， 定 义 块 的 天才 是 值 域 其 矿 二 的 2 倍 。 通 
过 像 系 点 的 收缩 得 到 与 值 域 块 大 小 相同 的 像素 块 。 然 后 对 每 个 收缩 后 的 定义 其 进行 8 种 
变换 (4 个 旋转 ，4 个 反射 )， 变 换 后 的 块 构成 码 本 块 M. 

2) 匹配 。 对 值 域 块 与 变换 后 的 定义 域 块 进行 匹配 。 其 匹配 的 原则 是 在 码 本 块 中 选 
取 适 当 的 M 块 ， 并 且 通 过 计算 得 到 适当 的 平移 因子 o、 比 例 因 子 c， 一 般 情况 下 ， 按 照 
压缩 映射 不 动 扩 与 拼接 定理 的 要 求 ，c 的 取 值 范围 为 0 三 c < 1， 最 终 要 使 得 通过 变换 
cM *ol (7 为 一 个 2 x2 的 单位 矩阵 ) 后 得 到 的 变换 块 与 值 域 块 均 方差 度量 4, 最 小 。 
d, 的 表示 却 如 下 : 








d, = (a; - cb, - oY 
i-l 


式 中 ，@a, 为 值 域 块 中 像素 的 值 ，b, 为 码 本 块 中 像素 的 值 ，m 为 值 域 块 中 像素 的 个 数 〈 与 
码 本 块 中 像素 的 个 数 相 等 )。 

3) 编码 。 对 每 个 值 域 块 都 要 在 人 码 本 块 中 进行 搜索 ， 找 到 与 其 最 佳 岂 配 的 码 本 块 、c 值 
与 o 值 。 记 录 下 此 时 定义 域 块 的 位 置 、 变 换 的 类 型 (8 种 变换 中 的 一 种 )、c 值 与 o 值 ， 即 完 
成 编码 的 过 程 。 

通过 上 述 步 又 可 以 看 出 ，PIFS 分 形 压缩 的 依据 是 图 像 局 部 块 之 间 存 在 相似 性 。 

例 程 6-9 是 实现 PIFS 分 形 压 缩 的 MATLAB 代码 ， 其 运行 结果 如 图 6-13 所 示 。 

例 程 6-9 
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DATA-imread('panda.]pg^; 
DATA-rgb2gray(DATA); 
tic 

DATA-double(DATA); 
sizel-size(DATA); 


% 分 块 ; 
tu-DATA(I1:sizel(1),1:sizel(2),1); 
xx-sizel(2); 

yy-sizel(1); 

nrx—xx/8; 

nry—-yy/8; 

ndx-xx/16; 

ndy-yy/16; 


DD-zeros(ndy,ndx,8,64); 
cund1-zeros(16,16); 
cund2-zeros(8,8); 
cund3-zeros(1,64); 
cund33-zeros(1,64); 
cund4-zeros($8,8); 


RRR-zeros(nry,nrx,6); 

















FT. [mpi TEL * AC 71 
som 实战 案例 详解 
cunr—zeros(1,64); 
for i-1:ndy 
for j71:ndx | 
cund1-tu(1--16*(1-1):16-16*(i-1),14-16*(j71):16-16*(j-1)); D 
for 1=1:8 
for m=1:8 


cund2(1,m)=(cund1(1+2*(1-1),1+2*(m-1))+cund1(2+2*(1-1),2+2*(m- 
1))+cund1(2+2*(1-1),1+2*(m-1))}+cund1(1+2*(1-1),2+2*(m-1)))/⁄4; 
end; 
end; 


DD(1,j,1,1:64)—reshape(cund2,[1,64]); 
cund4-fliplr(cund2); 
DD(1,j,2,1:64)-reshape(cund4,[1,64]); 
cund4-flipud(cund2); 
DD(i,j,3,1:64)-reshape(cund4,[1,64]); 
cund4-flipud(fliplr(cund2)); 
DD(1,5,4,1:64)—reshape(cund4,[1,64]); 
cund4-rot90(flipud(cund2)); 
DD/(1,j,5,1:64)-reshape(cund4,[1,64]); 
cund4-rot90(cund2); 
DDí(1,j,6,1:64)-reshape(cund4,[1,64]); 
cund4-rot90(rot90(rot90(cund2))); 
DD(i,j,7,1:64)-reshape(cund4,[1,64]); 
cund4-cunq2'; 
DD(1,j,8,1:64)-reshape(cund4,[1,64]); 
end; 
end; 


% 匹配 


for i-l:nry 

for Jj=1:nrx 
cunr-reshape(tu(148*(1-1):8-8*(1-1),18*(j-1):8*-8*(j-1)), [1,64 ]); 
sumalpha-sum(cunr); 
sumalpha2-norm(cunr)^2; 
dx-l; 
dy-l; 
ut-l; 
minH-10^20; 
minot-0; 
minst-0; 
for k-1:ndy 

for I-1:ndx 
for m-1:8 
cund3(1:64)-DD(k,l,m,1:64); 








oh 





MATLAB senteze — 


sumbeta=sum(cund3); 

sumbeta2-norm(cund3)^2; 

alphabeta-cunr*cund3'; 

if (64*sumbeta2-sumbeta^2)——0 
st-(64*alphabeta-sumalpha*sumbeta)/(64*sumbeta2-sumbeta^2); 
elseif (64*alphabeta-sumalpha*sumbeta)—-0|[st > 1 || st « -1 


st-0; 
else 

st-10^20; 
end; 


ot-(sumalpha-st*sumbeta)/64; 





H-(sumalpha2-st*(st*sumbeta2-2*alphabeta-*2 *ot*sumbeta)-*ot*(64*0t- 


2*sumalpha))/64; 


end; 
end; 


if H«xminH 
dx-l; 
dy-k; 
ut-m; 
minot-ot; 
minst=st; 
minH=H; 
cund33=cund3; 
end; 
end; 
end; 
end; 
RRR(i,j, 1 )=minst; 
RRR(i,j,2)7minot; 
RRR(1j,3)-dy; 
RRR(i,j,4)-dx; 
RRR(i,j,5)-ut; 
RRR(i,j,6)2minH; 


9o fuf 
huifu-ones(yy,xx); 
for iter-1:10 


for i-l:nry 


for Jj=1:nrx 


sSt-RRR(1,j,1); 
ot-RRR(i1,j,2); 
dy-RRR(1,j,3); 
dx-RRR(1,j,4); 
ut-RRR(1,j,5); 


cundl-huifu(1--16*(dy-1):164-16*(dy-1),1--16*(dx-1):16-16*(dx-1)); 








zot QUEITLI: 





for 1=1:8 
for m=1:8 
cund2(1,m)=(cund1(1+2*(1-1),1+2*(m-1))}+cund1(2+2*(1-1),2+2*(m- 
1))+cund1(2+2*¥(1-1),1+2*(m-1))}+cund1(1+2*(1-1),2+2*(m-1)))/⁄4; GS 
end; 





end; 
switch ut 
case 1 
cund4-cund2; 
case 2 
cund4-fliplr(cund2); 
case 3 
cund4-flipud(cund2); 
case 4 
cund4-flipud(fliplr(cund2)); 
case 5 
cund4-rot90(flipud(cund2)); 
case 6 
cund4-rot90(cund2); 
case 7 
cund4-rot90(rot90(rot90(cund2))); 
case 8 
cund4=cund2'; 
end; 
huifu(1--8*(i-1):88*(i- 1), 1-8*(j- 1):8*-8*(j-1))7st*cund4-ot; 
end; 
end; 


end; 
toc 


% 计算 mse 
mse=0; 
for i-l:nrx 
for Jj=1:nry 
a-(DATA(,])-huifu(1,]))^2; 
mse-mse-ta; 
end 
end 
mse-mse/(256*256); 
psnr-10*1og10((255*255)/mse); 
Igray = mat2gray(DATA); 
huifu = mat2gray(huifu); 
subplot(1,2,1),1mshow(Igray); 
subplot(1,2,2),àmshow(huifu); 


uLLLLLELLLLLLELLLLLLLLELLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL 
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a) b) 
Kle-13 WIFE 6-9 的 运行 结果 
a) 输入 的 原始 图 像 b) 压缩 后 的 图 像 
pae 1 
经 验 分 享 ， 图 像 压缩 的 评价 标准 
压缩 比 和 失真 性 是 衡量 图 像 压缩 的 重要 指标 。 
(1) 压缩 比 : 图 像 压缩 前 后 的 信息 量 之 比 。 
(2) 失真 性 : 该 性 能 指标 主要 是 针对 有 损 编码 而 言 的 ， 是 指 图 像 经 有 损 压 缩 ， 然 后 
其 解码 后 的 图 像 与 原 图 像 之 间 的 误差 。 有 损 压 缩 会 使 原始 图 像 数 据 不 能 完全 恢复 ， 信 息 
到 一 定 的 损失 ， 但 压缩 比较 高 ， 复 原 后 的 图 像 存在 一 定 的 失真 。 


6.4 安防 领域 的 应 用 : 高 效 视 频 监控 系统 


随 看 计算 机 技术 、 传 感 费 拉 术 的 飞速 发 展 ， 数 字 图 像 处 理 在 安防 领域 的 应 用 日 益 广 
沁 ， 视 频 监控 系统 就 是 一 个 典型 的 应 用 。 在 日 主 银行 、 集 车 场 、 交 通 指 挥 中 心 ， 监 控 系 
统 的 监视 摄像 系统 每 天 都 会 记录 大 量 的 数据 ， 如 何人 存储 这 些 视频 信息 是 一 个 叹 竺 解决 的 
问题 。 

传统 的 方法 是 使 用 视频 压缩 技术 ， 但 算法 较为 复 杀 ， 压 缩 比 有 限 ， 不 能 从 根本 上 解 
决 大 量 数据 存储 的 问题 。 对 于 监控 录像 ， 人 们 可 能 只 对 监控 区 域 中 的 友 生 变化 的 画面 感 
兴趣 ， 长 时 间 记 录 议 止 画 而 是 没有 必要 的 ， 因 此 ， 只 记录 变化 帆 图 像 可 大 大 减少 视频 图 
像 的 存储 量 。 

基于 上 述 分 析 ， 本 节 采 用 帧 间 送 分 检 剖 运动 物体 的 原理 建立 一 个 视频 监控 系统 ， 记 录 人 
们 “ 感 兴趣 ”的 运动 画面 。 与 其 他 监控 系统 相 比 ， 本 市 所 设计 的 视频 监控 系统 存储 数据 量 
低 、 算 法 实现 简单 、 对 便 件 要 求 低 ， 上 共有 民 好 的 工程 应 用 价值 。 


视频 监控 系统 的 基本 原理 
本 节 所 设计 的 视频 监控 系统 ， 利 用 帧 间 差 分 原理 ， 判 断 前 后 两 帧 画面 古 侍 存 在 莽 异 : 
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Sos QUDEAIZEA: 





SAD - Z2. 6.07 14,7) 





AU. LG). aij) Jy 计算 得 到 的 SAD EAEE TT] B 
值 ， 即 开始 记录 当前 画面 ， 直 到 SAD 值 小 于 冰 值 则 集 止 记录 面向 。 其 流程 如 图 6-14 所 示 。 
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图 6-14 ”监控 系统 流程 图 


WPA 基于 Computer Vision System 的 系统 设计 





根据 图 6-14 所 示 的 原理 ， 在 MATLAB 的 Computer Vision System 工具 箱 中 ， 搭 建 如 图 
6-15 所 示 的 系统 ， 系 统 各 功能 模块 及 其 路 径 如 表 6-1 所 列 。 
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图 6-15 基于 Computer Vision System 工具 箱 所 搭建 的 监控 系统 
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表 6-1 6-15 所 示 的 各 功能 模块 及 其 路 径 


J 能 

视频 源 Image From File 
差分 系统 Subsystem 

触发 器 Subsystem 

Be En Relational Operator 

E Constant 

采集 视频 Video Viewer 
记录 视频 Video Viewer 


图 6-15 所 示 的 系统 中 ， 有 两 个 子 系统 。 前 先 介 绍 差分 子 系统 ， 其 内 部 结构 如 图 6-16 所 


未 ， 各 功能 模块 及 其 路 径 如 表 6-2 所 列 。 


IN 
ES 


路 12 
Computer Vision System/Block Library/Sources 
Simulink/ Commonly Used Blocks 
Simulink/ Commonly Used Blocks 
Simulink/ Logic and Bit Operation 
Simulink/ Commonly Used Blocks 
Computer Vision System/Block Library/Sinks 
Computer Vision System/Block Library/Sinks 
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X 能 
单元 延迟 
XSERHAT EZ fH 


Unit Delay Simulink/Discrete 


Template Matching 


Sum of 
Absolute Metric 
Differenoes 


Unit Delay Template Matching 


图 6-16 差分 子 系 统 内 部 结构 


表 6-2 ”差分 子 系统 各 模块 及 其 路 径 






Computer Vision System/Block Library/Analysis&Enhancement 


双击 差分 子 系统 Template Matching， 对 其 进行 如 图 6-17 所 示 的 设置 。 





Template Matching 


Perform template matching by shifting the template in szingle-pixel increments throughout the 
interior of image I. 


You can use the ROI port to define a region of interest (ROI) over which you want to perform 
template matching. Ihe format of the ROI port is [x y width heigh], where [x y] are aone-based 
coordinates of the upper left corner of a rectangle. 


The block outputs either the match metric values at the Metric port or the one-based [x y] 


coordinates of the best template match at the Loc port.  Optionally, the block can output an N= 
by-H natrix of the mstch metric values centered around the best match location at the NMetric 


Paraneterz 


Match metric 





Üutput options 


: Li DE OU 
Dutpu 和 Etrac aatziz 一 > 
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图 6-17 Template Matching 属性 设置 


实战 案例 详解 





触发 毅 子 系统 的 内 部 结构 如 图 6-18 所 示 。 





6-18 ”触发 右 子 系统 内 部 结构 


双击 触发 器 子 系统 ， 在 其 添加 Enable 模块 (该 模块 的 路 径 为 Simulink/ ports 
&subsystem)， 并 对 其 进行 如 图 6-19 所 示 的 设置 。 





| Place this block in a subsystem or at the root level of a model 
to create an enabled system. 


Placing this block at the root level of a model enables a 
Signal Attributes tab. 


States when enabling: |he 
Propagate sizes of variable-size signals: 


Show output port 
Enable zero-crossing detection 


(sss) [cancer] (Hepa) sy | 


6-19 Enable 模块 参数 设置 


通过 上 述 步 又， 两 个 子 系统 已 经 设置 完毕 。 下 面 讨 论 图 6-15 所 示 框 图 中 各 模块 的 属性 


设置 。 
双击 “视频 源 ” 模 块 〈(Image From File)， 进 行 如 几 6-20 和 图 6-21 所 示 的 设置 ， 特 别 注 
意 的 是 需要 将 “输入 视频 凑 色 ” 设 为 “ 灰 度 〈JIntensity)”， 将 其 “数据 奖 型 ” 设 为 “ 双 精 度 


型 (double )”。 




















From Multimedia File 


Reads multimedia files containing audio, video, or audio and 
video data. 


For Windows platforms, this block reads compressed or 
uncompressed multimedia files. 


For non- Windows platforms, this block reads uncompressed 
video and audio AVI files, and video only, compressed or 
uncompressed files. 


Main ti 
Faraneters 


[V] Inherit sample time from file 


Humber of timez to play file: inf 


Qut puts 
F] Output end-of-file i: 


Üutput color format 


图 6-20 ”视频 源 模块 设置 1 





Source Block P 

From Multimedia File 
Reads multimedia files containing audio, video, or audio and 
video data. 


For Windows platforms, this block reads compressed or 
uncompressed multimedia files. 


For non- Windows platforms, this block reads uncompressed 
video and audio AYI files, and video only, compressed or 
unconpressed files. 


Main | Data Types 


Paraneterz 


Video output data Qu 3 





图 6-21 视频 源 模块 设置 2 


ut BE” BIA. HH "BH" uU “800”, 如 图 6-22 所 示 。 


Output the constant specified by the 'Constant value’ parameter. If 
"Constant value’ is a vector and 'Interpret vector parameters as l=D" is 
On, treat the constant value az a l-D array. Otherwise, output a matrix 
with the same dimensions as the constant value. 


[F] Interpret vector parameters as l-D 


Sapling mode: 


Sample time: 


inf 


[| 


6-22 


比较 器 的 参数 设置 如 图 6-23 所 示 。 


Relational Üperator 





闵 值 模块 设置 


Applies the selected relational operator to the inputs and outputs the result. Ihe top (or 


left) input corresponds to the first operand. 





6-23 ”比较 器 的 参数 设置 











Sos QUDEAIIEA: 





在 完成 上 述 设 置 之 后 ， 便 可 运行 模型 了 。 模 型 的 运行 效果 如 图 6-24 所 示 。 
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图 6-24 图 6-15 所 示 模 型 的 运行 结果 


6.5 “交通 领域 中 的 应 用 : 基于 视频 的 车 流量 统计 


近 几 十 年 来 ， 世 界 工业 技术 得 到 了 突 飞 狐 进 的 发 展 ， 各 国 汽车 数量 增长 迅猛。 根据 来 目 








公安 部 交通 管理 局 的 消 奶 ， 目 前 我 国 机 动车 保有 量 已 达 1. 99 亿 辆 ， 其 中 汽车 8500 多 万 辆 。 
汽车 数量 的 迅速 增加 造成 交通 拥挤 严重 、 交 通 事故 频 发 、 交 通 环境 恶化 等 影响 ， 给 我 国 城市 
道路 交通 问题 提出 了 严峻 考验 。 

蝴 看 我 国 国民 经 济 珊 速 及 展 和 城市 化 进程 的 加 快 ， 机 动车 拥有 量 及 道路 交通 量 忽 剧 增 
加 。 尤 其 是 大 城市 ， 交 通 拥 挤 堵塞 以 及 由 此 导致 的 一 系列 交通 事故 以 及 环境 污染 等 ， 神 是 我 
国 城市 面临 的 极其 严重 的 “城市 病 ” 之 一 ， 而 且 它 已 经 成 为 制约 国民 经 济 友 展 的 瓶颈 问题 。 

交通 信息 检测 系统 被 广泛 应 用 于 交通 运输 生产 实践 中 ， 检 测 的 内 容 包括 每 个 车 道 所 通过 
的 于 流量 、 和 车辆 平均 速度 和 瞬时 速度 、 和 车 型 分 类 、 平 均 千 距 、 着 路 占有 座 等 信息 ， 对 于 交通 
运行 效率 和 安全 有 看 非常 重要 的 应 用 价值 。 目 前 ， 公 路 监控 系统 大 多 及 用 感应 式 线 疾 的 检测 
方法 ， 在 应 用 中 存在 施工 、 维 护 困 难 等 缺点 ， 与 之 相 比 ， 基 于 视频 的 检测 方法 除 能 够 得 到 感 
应 式 线 疾 所 能 检测 的 数据 外 ， 还 可 以 能 够 获得 更 多 的 交通 流 信 息 ， 如 监视 大 范围 场景 ， 识 列 
车 辆 类 型 和 和 车辆 运行 轨迹 等 ， 男 一 个 优点 是 安 疙 维护 时 不 影响 道路 的 使 用 。 

视频 竺 辆 检测 磊 将 视频 摄像 机 作 传 感 邦 ， 在 视频 范围 内 设置 虚拟 线 罗 ， 即 检测 区 ， 芋 辆 
进入 检测 区 时 使 背景 灰 度 值 发 生变 化 ， 从 而 得 知 车辆 的 存在 ， 并 以 此 检测 千 辆 的 流量 和 速 
度 。 检 训 需 可 安 闭 在 车 道 的 上 方 和 侧面 ， 与 传统 的 交通 信息 采集 技术 相 比 ， 交 通 视 频 检 测 拉 
术 可 提供 现场 的 视频 网 像 ， 上 只 有 直观 可 笔 、 安 靖 调 试 维护 方便 、 价 格 便宜 等 优点 ， 但 容易 受 
恶 务 天气 、 灯 光 、 明 影 等 环境 因 系 的 影响 ， 汽 车 的 动态 阴影 也 会 带 来 干扰 。 综 合 来 襄 ， 从 所 
获得 的 信息 量 角 度 ， 视 频 检测 器 无 疑 古 最 佳 选择 ， 这 是 由 视频 拉 术 本 里 的 特点 所 决定 的 。 视 
频 榨 测 絮 是 采用 虚拟 检测 区 域 用 图 像 处 理 方式 分 析 交 通信 息 ， 随 看 图 像 处 理 搁 术 的 及 展 ， 视 
频 检测 成 为 了 一 种 成 熟 的 技术 ， 逐 步 达 到 了 类 似 人 眼 的 “所 见 即 所 得 ”的 效 琳 。 
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车 流量 检测 系统 














交通 流量 检测 是 智能 交通 系统 中 的 重要 组 成 部 分 ， 交 通信 息 2s 
Y AP AM S > Hr. Ns SPES Yn a i 3 o - 
的 收集 是 智能 交通 系统 的 基础 ， 实 时 、 可 靠 的 基本 交通 信息 是 判 


采 交 通 状况 的 根本 依据 ， 也 是 智能 交通 系统 科学 控制 和 管理 人 、 
车 、 路 的 前 握 。 基 于 视频 的 车 流量 统计 方法 可 分 为 虚拟 检测 线 法 
和 竺 辆 跟 踩 法 两 大 类 。 虚 拟 检 训 线 法 的 工作 诛 理 闫 似 于 地 埋 式 线 
图 检测 右 。 用 户 在 图 像 上 定义 检测 区 域 位 置 ， 当 车 辆 经 过 该 区 域 
时 ， 必 然 引 起 局 部 区 域 的 视觉 信息 变化 ， 系 统 通 过 虚拟 检测 线 变 
化 强度 来 判断 和 车辆 经 过 与 个 ， 进 而 可 以 计算 车 流量 。 该 方法 运算 
量 小 ， 在 满足 实时 要 求 的 前 如 下 完成 流量 检 汕 ， 同 时 也 未 能 充分 
利用 图 像 信息 ， 降 低 了 系统 的 可 徘 性 。 和 车辆 跟踪 法 则 是 通过 识别 
出 区 通 场 景 图 像 中 符合 车 辆 特征 的 像素 ， 进 行 图 像 分 割 ， 并 依据 
提取 出 的 特征 来 匹配 前 后 两 幅 图 像 中 的 和 车辆 ， 从 而 计算 车 流量 。 
本 市 采用 虚拟 检测 线 的 方法 统计 和 车 流量 。 车 流量 检测 系统 的 检测 
流程 如 图 6-25 所 示 。 

在 整个 实现 过 程 中 ， 背 景 建 模 是 核心 ， 本 节 米 用 基于 局 斯 混 。 图 6-25 系统 实现 流程 
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合 模 型 的 背景 建 模 方法 。 
IET SEUES HABUI 























i EH UNUS (Gaussian Mixture Model) 是 单 高 斯 模型 的 改进 算法 。 在 单 高 斯 背景 
模型 中 将 单个 高 斯 分 布 作为 相应 某 一 像素 值 的 概率 密度 分 布 ， 泥 合 融 斯 背景 模型 对 其 进行 了 
扩展 ， 通 过 多 个 高 斯 概率 密度 函数 的 加 权 平 均 来 平滑 地 近似 任意 形状 的 密度 分 布 函数 。 令 
I(x, y,t) 表示 像素 点 (x,y, 人) 在 t 时刻 的 像素 值 ， 则 有 : 


K 
P(I(x, y» [)) = D ©; n; (x, U; , O; ) 


其 中 天 NEMIRA, MC A ea nde SEE REB RS RA o 为 1 时 刻 第 i 个 局 
斯 分 量 的 加 权 系 数 ， 即 权重 。 

对 于 一 个 像素 的 K 个 高 斯 分 量 ， 根 据 w/o 的 值 对 它们 从 大 到 小 进行 排列 ， 满 足下 式 的 
Bi B A S EAT BC TEXT SCORE. 





























: o,» TI 


k=1 


B= argmin | 





其 中 7 是 背景 模型 占有 高 斯 分 布 的 最 小 比例 ， 通 常 为 0.7, WRT 太 小 则 退化 为 单 高 
斯 ，7 较 大 则 可 以 描述 复杂 的 动态 背景 。 

对 于 当前 像素 (x,y,7?) ， 如 果 它 的 值 T(x,y,?) 与 其 背景 模型 中 第 k(kx << B) 个 高 斯 分 布匹 
配 ， BI I(x,y,r) TE ut - Ax oput t Ax ot | 范围 之 内 ， 4 一般 设置 为 2.5， 那 么 该 像素 被 认为 


是 背景 ， 盏 则 是 前 景 。 令 输出 图 像 为 output ， 公 式 如 下 。 
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0,u, - Axo, <Ix, yt) Su, +Axo, and k < B 


output(x, Y» [) = f 
l, otherwise 














在 检测 完 前 景 之 后 ， 若 该 像素 被 认为 是 前 景 ， 即 前 B 个 高 斯 分 布 中 没有 一 个 与 之 匹配 ， y 
则 用 一 个 新 的 局 斯 分 布 取代 权重 最 小 的 那个 高 斯 分 布 。 新 的 分 布 的 期 望 值 即 为 当前 的 像素 D 
值 ， 同 时 为 它 分 配 一 个 较 大 的 初始 偏差 std_init 和 较 小 的 初始 权重 值 weight init 。 

各 该 像素 饿 认为 是 背景 ， 则 对 该 像 聚 的 各 个 融 斯 分 布 的 权重 做 如 下 调整 。 

o; =(-a)xo +axD,(i< M) 

其 中 c 为 学 习 率 ， 值 在 0 一 1 之 间 。 如 来 第 i 个 高 斯 分 布 与 当前 像素 匹配 ， 则 D, =1， 
FMJD, 20. 

对 于 与 当前 像素 区 配 的 局 斯 分 布 ， 更 新 它们 的 期 望 值 和 偏 产 值 : 

uj =(1-PB)xu + px I(t) 


o; =(1-p)xo f + Bx(( -uy 


ft | P 




















例 程 精 讲 
例 程 6-10 调用 MATLAB 2012 中 Computer Vision System 工具 箱 的 系统 对 象 (system 
object) 来 实现 车 流量 计数 ， 其 流程 如 图 6-25 所 示 ， 运 行 效 果 如 图 6-26 所 示 。 
例 程 6-10 





KK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K FK K K K K FK K K K K FK K K K K FK K K K K K K K K K K K K K K K K K K 
% 创建 系统 对 象 ， 用 于 读 入 竺 处 理 视 频 
filename = 'viptraffic.avi'; 
hvfr = vision. VideoFileReader(filename, 'ImageColorSpace', 'RGB); 
% 创建 系统 对 象 ， 用 于 色彩 空间 转换 
hesc = vision.ColorSpaceConverter('Conversion', 'RGB to intensity'); 
% 创建 系统 对 象 ， 用 于 用 高 斯 混合 模型 检测 背景 
hfdet = vision.ForegroundDetector(... 
'NumTrainingFrames', 5, ... % 取 和 连续 五 帧 进行 检测 背景 
'InitialVariance', (30/255)^2); | % 初始 标准 差 为 30/255 
% 创建 系统 对 象 ， 用 于 检测 出 包含 汽车 运动 的 图 像 块 
hblob = vision.BlobAnalysis( ... 
'CentroidOutputPort', false, ... 
'AreaOutputPort,, true, ... 























'BoundingBoxOutputPort', true, ... 
'OutputDataType!', 'single', ... 
'MinimumBlobArea', 250, ... 
'MaximumBlobArea', 3600, ... 
'MaximumCount', 80); 

% 创建 系统 对 象 ， 用 于 对 检测 出 的 运动 车 辆 进行 框 画 


hshapeins = vision.ShapelInserter( ... 
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'BorderColor', 'Custom', ... 
'CustomBorderColor', [0 255 0]); 
% 创建 系统 对 象 ， 用 于 标注 检测 到 和 车辆 的 个 数 
htextins = vision.TextInserter( ... 
"[ext', 9o4d', ... 
Location, [1 1], ... 
'Color', [255 255 255], ... 
'FontSize', 12); 


% 创建 系统 对 象 ， 用 于 显示 结果 

sz = get(0,'ScreenSize'); 

pos = [20 sz(4)-300 200 200]; 

hVideoOrig = vision.VideoPlayer('Name!', 'Original', 'Position', pos); 
pos(1) = pos(1)+220;”% 在 右 侧 建立 下 一 个 视窗 

hVideoFg = vision. VideoPlayer('Name', 'Foreground', 'Position', pos); 
pos(1) = pos(1)7-220; 

hVideoRes = vision.VideoPlayer('Name!', 'Results', 'Position', pos); 
line row 723; % 定义 感 兴趣 区 域 (ROT) 


% 以 下 的 程序 段 为 对 输入 的 视频 图 像 进 行 处 理 
while ~isDone(hvfr) 
image = step(hvfr); Vo TN TUR RE nt 
y = step(hcsc, image); vo 将 彩色 图 像 转换 成 灰 度 图 像 





% 采用 上 自动 白 平 衡 算法 去 除 灰 度 突变 
y=y-mean(y(:)); 


fe image = step(hfdet, y); % 检验 背景 


% 采用 数学 形态 学 ， 在 前 景 图 像 中 检测 变化 的 联通 图 像 块 区 域 的 面积 
[area, bbox] = step(hblob, fe image); 


image out = image; 
image 0ut(22:23,,:)) 2255; % 仅 对 经 过 白 线 后 的 车 辆 进行 计数 
image out(1:15,1:30:) 2 0; 96 将 背景 置 为 黑色 














Idx = bbox(:,2) > line row; 。”% 选 择 感 兴趣 区 域 . 


% 当 在 感 兴趣 区 域 中 ， 联 通 图 像 块 的 比例 占 整个 变化 区 域 的 40% 以 上 时 ， 便 认为 是 车 辆 
ratio = zeros(length(Idx),1); 
ratio(Idx) = single(area(Idx,1))./single(bbox(Idx,3).*bbox(Idx,4)); 
ratiob = ratio > 0.4; 
count — int32(sum(ratiob)); vo 车 辆 的 数量 
bbox(-ratiob,:) = int32(-1); 


% 将 检测 出 的 车 辆 图 画 出 来 
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image out = step(hshapeins, image out, bbox); 





% 显示 检测 汽车 的 数量 


image out = step(htextins, image out, count); 
| 








step(hVideoOrig, image); % 原始 视频 

step(hVideoFg, fg image); Vo 前 景 

step(hVideoRes, image out); vo 用 方 框 勺 男 检测 出 的 车 辆 
end 
% 天 闭 视 频 文件 
release(hvfr); 
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图 6-26 WIFE 6-10 的 运行 结果 


spete eea ae 0 2 RD e e a pus ue 


经 验 分 享 : 如 何 使 用 MATLAB 系统 对 象 Cvision.x) 进行 编程 f 
MATLAB 2012 中 Computer Vision System 8 — KAFE RAA A Aat $-. (System | 
Object) 进行 编程 ， 其 提供 了 涉及 视频 显示 、 视 频 读 写 、 特 征 检测 、 提 取 与 匹配 、 目 标 检 | 
测 、 运 动 分 析 与 跟踪 、 EM bells! 滤波 、 几 何 变 换 、 数 学 形态 学 操作 、 统 H 
. 计 、 添 加 文字 和 绘 国 、 图 像 变 换 等 功能 (各 系统 对 象 及 其 功能 见 本 书 附录 AO ， i 


现 通过 P 面 实例 说 明 采 用 系 对 象 进行 编程 的 步 又 ， 下 面 程序 的 功能 是 采用 系统 对 象 纺 
程 的 形式 实现 快速 傅 里 叶 变 换 的 。 
(1) 创建 系统 对 象 


H=visionFFT 9e 创建 一 个 默认 的 系统 FFT 对 象 H，H 实现 的 功能 与 vision.FFT 相同 ; 


输入 上 述 指令 后 ， 合 令 徐 口中 会 显示 : 


se MÀ e MÀ MÀ t MÀ e A e MA 4-8 x 





H= 
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System: vision.FFT 


Properties: 
FFTImplementation: 'Auto' 
BitReversedOutput: false 

Normalize: false 


Show fixed-point properties 


可 见 ， 其 可 以 设置 的 属性 包括 FFTImplementation, BitReversedOutput, Normalize. 
接 看 ， 在 命令 窗口 中 输入 : 


% 创建 输入 数据 


Fs = 1000; Vo 采样 频率 ; 
T= 1/Fs; % 采样 时 间 ; 
L = 1024; Vo 信号 程度 ; 
t= (C:L-1)*T; vo 时 间 问 量 


% 生成 待 处 理 的 数据 问 量 
X = 0.7*sin(2*pi*50*t.') + sin(2*pi*120*t.); 


(2) 修改 系统 对 象 属性 


H.Normalize = true vo 将 Normalize 的 属性 ， 设 置 成 ture 





修改 后 ， 命 令 窗 口 会 显示 : 
H= 
System: vision.FFT 


Properties: 
FFTImplementation: 'Auto' 
BitReversedOutput: false 

Normalize: true 


由 此 可 见 ，Normalize 的 属性 已 经 被 设置 成 ture 
(3) 运行 系统 对 象 


Y = step(H,X); % 运行 系统 对 象 
注意 : 在 运行 Y= step(A,B); 时 ，A 为 系统 对 象 ，B 为 待 处 理 的 数据 。 


在 赋值 时 ， 也 可 以 采用 以 下 格式 : 系统 对 象 名 《属性 名 ， 值 的 形式 ) 
因此 ， 上 述 程序 义 可 以 写成 : 








H=vision.FFT('Normalize',true); 
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Fs = 1000; 
T= 1/Fs; 
L= 1024; 


t=(0:L-1)*T; 
X = 0.7*sin(2*pi*50*t.") + sin(2*pi* 120*t.; > 
Y=step(H,X); 
此 外 ， 还 可 以 不 创建 了 ， 直 接 调用 系统 对 象 vision.FFT 进行 处 理 。 因 此 ， 程 序 还 可 
以 与 为 : 








Fs = 1000; 

T= I/Fs; 

L = 1024; 

t-(0:L-1)*T; 

X = 0.7*sin(2*pi*50*t.") + sin(2*pi*120*t.; 
Y-step(vision.FFT('Normalize',true),X); 


其 他 与 数字 图 像 /视频 处 理 相 关 的 系统 对 象 及 其 功能 详 见 附录 B. 








f MATLAB s:54:::5 


第 7 章 BERAR 
本 章 导读 


通过 前 6 半 的 学 习 ， 读 者 应 该 对 数字 图 像 处 理 的 基本 知识 及 其 应 用 有 了 一 个 基本 的 了 
解 。 从 话说 :“ 授 人 以 鱼 ， 不 如 授 人 以 渔 。 ”学 习 探索 与 科学 研究 尔 是 如 此 。 本 章 络 合作 者 教 
学 、 科 研 的 心得 ， 从 学 习 经 验 、 思 维 方式 、 科 研 方法 、 处 理 技巧 这 四 个 方面 对 数字 图 像 技术 的 
学 习 和 科研 进行 点 拨 ， 使 读者 对 本 书 的 知识 、 方 法 、 理 念 能 够 融会 贯通 ， 学 以 致 用 。 























7.1 FJAR: 谈 学 习 数 字 图 像 处 理 的 经 验 


面向 应 用 : 层 层 分 解 、 抓 住 要 点 





学 习 数 子 图 像 处 理 的 最 终 目 的 还 是 应 用 。 无 论 研制 产品 还 是 研发 项 目 换 或 是 研究 诛 古 ， 
祁 要 用 数字 图 像 处 理 的 理论 、 方 法 和 技术 来 解决 实际 问题 。 在 此 过 程 中 ， 提 高 效率 是 非常 重 
要 的 ， 因 此 ， 在 实际 应 用 过 程 中 要 面 问 需求 ， 络 合 实际 ;将 问题 层 层 分 解 ， 理 清 解决 思路 ; 
抓 住 其 要 害 ， 集 中 力量 进行 突破 ， 切 忌 “ 眉 毛衣 子 一 把 抓 ”。 

下 面 惑 结合 笔者 所 研究 过 的 一 个 诛 题 进行 详细 说 明 。 

诛 题 任务 要 求 : 一 合 智能 移动 机 器 人 上 配备 有 单 目 可 见 光 视觉 传感器 ， 要 求 通过 该 视觉 
传 感 右 采集 的 视频 序列 网 像 ， 实 现在 复杂 环境 下 对 纹理 清晰 的 特定 目标 的 实时 跟 踩 。 

QE: 该 问题 的 解决 应 从 使 件 和 软件 两 个 方面 进行 车 屋 ， 对 使 件 的 选择 、 设 计 和 搭建 超 
出 了 本 书 所 讨论 的 内 容 ， 因 此 ， 本 文 仅 从 数字 图 像 处 理 方法 的 角度 进行 分 析 。) 

分 析 讨论 : 

(1) 任务 分 解 : 通过 对 任务 要 求 进行 分 析 可 知 ， 该 任务 的 核心 是 “目标 识别 跟踪 ”， 在 此 
基础 上 有 两 个 约束 条 件 :“ 复 杂 环 境 下 ”和 “实时 性 ”， 方 法 实现 的 平台 是 “移动 机 器 人 ”。 任 
务 的 核心 “目标 识别 跟踪 ”是 要 解决 的 难点 和 重点 ; 约束 条 件 “ 复 杂 环 境 下 ” 则 要 求 我 们 
对 所 采集 的 图 像 进 行 去 品 预 处 理 ， 约 束 条 件 “ 实 时 性 ”也 是 需要 解决 的 问题 ， 这 就 要 求 我 们 尺 
可 能 地 降低 各 种 算法 的 运算 复杂 度 ， 由 于 实现 平台 “移动 机 问 人 ”在 行进 过 程 中 采集 的 视频 图 







































































像 人 存在 抖动 现象 ， 因 此 ， 在 对 采集 的 图 像 进行 去 噪 后 需要 对 其 进行 增 稳 处 理 。 通 过 初步 分 解 ， 


图 像 增 稳 


就 得 到 了 任务 中 所 要 解决 的 问题 以 及 大 致 流程 〈 见 图 7-1)。 


核心 ， 目 标 跟 踪 一 一 > 识别 、 跟 踪 算法 





预 处 理 算 法 优化 
核心 算法 优化 目标 识别 


实现 平台 : 移动 机 器 人 一 一 > 图 像 增 稳 
目标 跟踪 


RA 


; | 复杂 环境 — — 图 像 去 品 
实时 性 一 一 算法 优化 | 








图 7-1 任务 分 解 及 流程 
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(20 难点 分 解 : 本 任务 的 难点 是 “目标 识别 跟踪”。 之 所 以 称 其 为 难点 ， 是 由 于 对 目标 
的 识别 和 跟 踩 过 程 中 ， 存 在 视觉 传 感 问 与 目标 物体 的 相对 运动 ， 因 此 ， 目 标 在 网 像 中 存在 痢 
尺度 变化 、 旋 转变 化 、 视 角 变 化 、 照 度 变 化 以 及 局 部 遮挡 ， 这 给 目标 识别 和 跟 踩 带 来 了 挑 
战 。 和 常用 的 目标 识别 与 跟踪 算法 有 : 基于 帧 间 差 分 的 目标 识别 与 跟踪 法 、 基 于 交流 的 目标 识 
别 与 跟踪 法 、 基 于 模板 匹配 的 目标 识别 与 跟踪 法 、 基 于 颜色 的 目标 识别 与 跟踪 法 、 基 于 特征 
点 的 目标 识别 与 跟踪 法 。 考 虑 到 每 种 方法 的 特点 以 及 竺 跟踪 目标 共有 清晰 的 纹理 ， 可 以 采用 
基于 特征 点 的 目标 识别 与 跟踪 法 ， 更 进一步 地 说 ， 应 采用 尺度 不 变 特 征 点 〈 详 见 本 书 4.6 
TO 作为 识别 与 跟踪 的 特征 ， 这 是 因为 尺度 不 变 特征 点 对 尺度 变化 、 旋 转变 换 、 视 角 变 化 、 
照度 变化 和 局 部 遮挡 具有 重 棒 性 。 同 时 ， 我 们 希望 目标 识别 和 跟踪 算法 具有 恨 好 的 实时 性 ， 
央 此 ， 可 以 考虑 PCA 一 SIFT 和 SURF 特征 点 作为 目标 特征 。 此 外 ， 由 于 视频 序列 相 邻 图 像 
之 间 存 在 相关 性 ， 目 标 在 相 邻 帧 之 间 不 会 有 剧烈 的 变换 ， 因 此 ， 可 采用 隔 帧 搜索 法 对 目标 进 
行 检 测 并 用 Kalman 滤波 或 粒子 滤波 对 目标 的 轨迹 进行 预测 。 难 点 分 解 的 过 程 如 几 7-2 所 
zs 































































































PCA-SIFT 隔 帧 检测 
不 变性 实时 性 相关 性 
目标 识别 跟踪 尺度 不 变 特征 点 SURF -一 
.. .其 他 改进 算法 vek TM 


图 7-2 难点 分 解 过 程 
G) 算法 分 解 : 经 过 任务 分 解 和 难点 分 解 后 ， 读 者 已 经 对 任务 的 实现 步 又 和 每 个 步骤 所 
需 的 算法 有 了 一 个 清晰 的 了 解 。 在 此 之 后 ， 还 需 对 每 一 个 具体 的 算法 进行 分 解 ， 形 成 实现 步 








又 ， 以 便于 后 续 的 研究 以 及 模块 化 分 工 实现 。 
面向 学 习 : 追根 溯源 、 比 较 总 结 











在 数字 图 像 处 理 中 ， 很 多 算法 是 一 脉 相 承 或 有 着 密切 联系 的 ， 搞 清楚 这 些 来 龙 去 脉 以 及 
相互 联系 ， 有 利于 加 强 对 算法 的 理解 以 及 改进 创新 。 

那么 ， 如 何 把 握 这 些 联系 呢 ? 首先 要 清楚 每 种 算法 的 提出 育 景 ， 即 “这 种 算法 为 什么 会 
被 提出 ”或 是 “这 种 算法 是 针对 什么 问题 而 提出 的 >。 以 本 书 第 2 和 草 中 数字 岁 像 变换 中 的 内 
容 为 例 ， 这 一 问题 是 从 图 像 的 空间 变换 讲 起 的 ， 但 是 空间 变换 无 法 反映 图 像 的 频率 分 布 信 
尽 ， 随 看 傅 里 叶 变 换 的 诞生 ， 这 一 问题 得 到 了 解决 ， 傅 里 叶 变 换 也 被 研究 者 誉 为 是 “图 像 处 
理 的 第 二 种 语言 >。 正在 人 们 为 之 欢欣 豆 舞 之 时 ， 研 究 者 有 发 现 傅 里 时 变换 也 存在 看 不 足 ， 
它 在 空域 上 无 任何 分 辨 不 能 作 局 部 分 析 。 为 此 ，D.Gabor 于 1946 年 提出 了 加 窗 傅 里 叶 变 
换 ， 也 就 是 著名 的 Gabor 变换 ， 它 通过 引入 一 个 时 间 局 部 化 “ 窗 函 数 ” 改 进 了 傅 里 叶 变 换 的 
不 足 ， 但 其 窗口 大 小 和 形状 都 是 固定 的 ， 没 有 从 根本 上 弥补 傅 里 时 变换 的 缺陷 。 此 时 ， 小 波 
变换 的 提出 从 根本 上 解决 了 这 一 难题 ， 它 有 一 个 灵活 可 变 的 时 间 一 频率 窗 ， 能 有 效 地 从 信和 号 
中 提取 信息 ， 通 过 伸缩 和 平移 等 运算 功能 对 函数 或 信号 进行 多 尺度 细 化 分 析 ,“ 数 学 显 微 
镜 ” 的 美誉 也 因此 得 来 。 如 果 读 者 能 够 把 这 些 联系 梳理 清楚 ， 那 么 ， 在 学 习 小 波 变换 时 就 会 
钦 然 开 衣 ， 应 用 也 会 游 刀 有 余 。 难 道 小 波 变换 就 那么 完美 吗 ? 答案 当然 是 否定 的 ， 当 前 有 很 
多 算法 就 如 何 提高 小 波 变换 的 效能 提出 了 改进 。 按 照 上 述 的 “联系 ”方式 〈 见 图 7-3)， 就 不 
难 建立 起 完备 的 知识 体系 。 









































MATLAB tanari 一 





E] 7-3 ”图像 分 析 联 系 示意 图 


谈 过 了 “追根 溯源 ”再 来 聊 聊 “比较 总 结 ” 这 里 以 本 书 4.3 节 图 像 的 边缘 检测 为 例 来 
进行 说 明 。 在 43 节 中 ， 介 绍 了 7 种 常用 的 边缘 检测 方法 ， 每 一 种 方法 都 能 实现 边缘 检测 ， 
但 对 于 同一 幅 图 像 ， 每 一 种 边缘 检测 方法 的 效果 又 不 尽 相 同 。 这 是 为 什么 呢 ? 原来， 每 一 种 
边缘 检测 的 方法 都 有 自己 优点 和 不 足 ， 都 有 自己 特定 的 应 用 背景 ， 可 以 对 其 进行 列表 比较 ， 
如 表 7-1 所 示 。 














表 7-1 边缘 检测 算 子 比较 











名 ^ 特 扩 
基于 一 阶 微分 算 子 检测 边缘 运算 简单 ， 但 对 噪声 敏感 
基于 LOG 算 子 检测 边缘 边缘 保留 较为 完整 、 定 位 准确 、 抗 干扰 能 力 强 
基于 Canny 算 子 检测 边缘 抗 干扰 能 力 强 ， 边 缘 连 续 性 好 
基于 SUSAN 算 子 检测 边缘 抗 噪声 能 力 好 、 运 算 量 小 ， 速 度 快 


对 各 种 边缘 检测 算 子 进行 比较 后 ， 它 们 各 自 的 特点 便 一 目 了 然 ， 在 何 种 情况 下 运用 哪 种 
边缘 检测 算 子 效果 最 佳 便 做 到 了 心中 有 数 。 

在 比较 完 各 种 边缘 检测 算 子 的 “个 性 ”之 后 ， 再 来 总 结 一 下 它们 的 “共性 ”。 尽 管 边 纤 
检测 的 方法 有 很 多 ， 但 各 种 方法 的 共同 目的 都 是 要 检测 出 图 像 灰 度 变 化 剧烈 的 区 域 。 从 数学 
的 角度 来 看 ， 就 是 对 数字 图 像 进行 差分 ， 从 信号 处 理 角 度 看 ， 就 是 用 高 通 滤波 器 来 保留 高 频 
信号。 


学 习 的 过 程 讲 完 循 序 渐进 ， 温 故 知 新 ， 对 数字 图 像 处 理 技术 的 学 习 也 不 例外 。 但 是 ， 数 
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7.2 ”思维 点 拨 : 运用 Triz 思维 ， 突 破 图 像 处理 瓶 颈 


在 学 习 和 研究 数字 图 像 处 理 技术 的 时 候 ， 通 营 会 遇 到 一 些 难题 ， 这 时 又 该 如 何 去 思考 和 
fidus? 这 也 是 广大 读者 极其 关注 的 一 个 问题 。 本 节 便 介绍 一 种 Triz 理论 (问题 解决 理 
论 )， 人 借助 它 为 谈 者 提供 解雇 数字 疼 像 处 理 中 瓶 倾 问题 的 思维 方法 。 


LEX Triz 理论 概述 | 


发 明 Triz 理论 的 是 前 苏联 著名 科学 家 Altshuler G S, MA 1946 年 开始 ， 其 倾 其 毕生 心血 
创立 了 创造 性 问题 解决 理论 和 方法 。 经 过 近 60 年 的 发 展 ，Triz 已 经 演化 成 为 一 套 系统 的 解 
决 各 类 复杂 技术 问题 的 方法 和 工具 ， 这 些 方法 包括 技术 进化 理论 、 发 明 原 理 、 发 明 问 题解 决 
算法 及 标准 解 等 。 这 些 方法 和 工具 可 以 帮助 设计 者 缩短 试验 纠 错 的 过 程 并 创造 性 地 解决 设计 
难题 。 

Triz 理论 在 解决 实际 问题 时 ， 首 先 将 具体 问题 归 类 为 管理 问题 、 物 理 问题 或 技术 问题 。 
如 条 是 技术 问题 ， 一 般 采 用 “39 矛盾 矩阵 ”与 “40 创新 原则 ”加 以 解决 。 

在 “39 矛盾 矩阵 ”中 ， 行 和 列 分 别 是 在 大 量 专利 分 析 基 础 上 总 结 出 来 的 39 项 标准 参 
数 ， 用 这 39 项 标准 参数 中 的 两 项 分 别 表示 矛盾 体 中 的 两 个 方面 ， 也 就 是 使 系统 性 能 改善 的 
特性 和 导 人 至 系统 性 能 恶化 的 特性 ， 那 么 在 矩阵 中 这 两 项 标准 参数 所 在 行列 的 交叉 点 束 对 应 看 
实践 证 明 最 为 有 效 的 予 盾 解决 原理 ， 基 于 这 些 巴 盾 解 决 原理 的 启发 就 可 以 寻求 具体 的 解决 方 
案 。 而 这 些 创 狐 原则 也 有 更 具体 的 说 明 来 辅助 设计 者 问 看 正确 的 方 加 思考。 图 7-4 Triz 理 
论 中 39 矛盾 矩阵 和 40 创新 原则 的 使 用 示意 图 。Triz 矛盾 矩阵 、39 项 技术 参数 以 及 40 创新 
原则 见 附录 C. 
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图 7-4 Triz 理论 中 39 ZF ECKE IPEA. 40 创新 原则 的 使 用 示意图 


利用 Triz 原理 解决 问题 的 流程 如 图 7-5 所 示 。 例 如 ， 设 计 一 个 能 够 有 省 电 模 式 却 不 影响 
照明 效果 的 灯具 ， 那 么 使 用 “39 矛盾 矩阵 ”要 改善 的 特性 为 20 (物体 消耗 能 量 )， 要 避免 恶 
化 的 特性 为 18《〈 明 度 变 差 )， 从 和 矩阵 找 出 特性 经 由 两 者 的 相交 点 ， 可 以 发 现 4 个 可 能 解决 该 
矛盾 的 创新 原则 : 9 周期 性 的 作用 )、2 〈 抽 离 )、32《〈 人 性质 的 转变 )、35$《〈 改 变 颜色 )。 此 处 
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就 是 在 楼 道中 的 声控 灯 。 由 此 可 见 ，Triz 理论 使 技术 创新 问题 变 得 有 据 可 香 、 有 规律 可 循 ， 
大 大 纵 短 了 新 技术 的 开发 周期 。 
















| "| 39 矛 盾 和 矩阵 MS 
确立 予 盾 对 
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40 创 新 原理 





基础 理论 


技术 案例 





下 面 通过 一 个 例子 来 介绍 Triz 理论 在 图 像 处 理 领域 中 的 应 用 ， 以 起 到 抛砖引玉 的 作用 。 

通过 本 书 2.6 PIHTA, Hough 变换 存在 运算 量 大 的 不 足 ， 如 何 提升 Hough 变换 的 
实时 性 是 一 个 驭 竺 解决 鸭 瓶 领 问题 。 

通过 Triz 理论 解 次 上述 问 题 的 步骤 如 下 。 

(1) Hos: 在 较 短 的 时 间 内 获得 图 像 的 Hough 变换 。 

(2) 确立 矛盾 对 、 定 位 39 矛盾 矩阵 。 

通过 前 面 的 分 析 可 知 ， 该 问题 的 主要 了 矛盾 是 变换 精度 与 变换 速度 之 间 的 矛盾 。 用 Triz 理 
论 可 以 将 其 具体 化 为 速度 与 信息 损失 的 矛盾 。 这 对 矛盾 在 Triz 理论 的 39 矛盾 矩阵 中 定位 如 
图 7-6 所 示 。 


























图 7-6 Hough 站 盾 对 在 39 X JEDE PEHR ITI XE B 


如 图 7-6 所 示 ， 根 据 Triz 理论 ， 可 用 13. 26 两 个 创新 原理 解决 Hough 变换 中 的 了 矛 
盾 冲 突 。 
(3) 获得 矩阵 解 。 
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1) 第 13 条 创 独 原理 一 一 相反 原则 〔 逆 问 作 用 法 )， 给 出 的 上 其 体 解决 方案 是 。 

CD 不 用 常规 的 解决 方法 ， 而 是 有 反 其 站 而 行 之 。 

D 使 物体 或 外 部 介质 的 活动 部 分 变 成 为 不 动 的 ， 而 使 不 动 的 成 为 可 动 的 。 

(3) 将 物体 运动 部 分 籁 倒 。 

2) 第 26 条 创新 原理 一 一 复制 原则 《复制 法 )， 给 出 的 具体 解决 方案 是 。 

CO 用 重音 而 便宜 的 复制 品 代 父 难以 得 到 的 、 复 倚 的 、 郧 吐 的 、 不 方便 的 物体 。 

D 用 光学 图 像 蔡 代 单 件 物品 或 系列 物品 ， 然 后 图 像 可 放大 或 综 小 。 

(3) 可 见 光 仪器 可 由 红外 线 或 系 外 线 仪器 奉 代 。 

根据 第 26 条 创新 原理 一 复制 原则 《复制 法 ) 的 包 可 以 得 出 如 下 解决 思路 : 将 图 像 通 
过 多 分 辩 率 金字 培 变 换 对 其 采样 ， 在 低 分 辨识 图 像 中 提取 直线 的 参数 ， 然 后 将 所 提取 得 直线 
参数 根据 低 分 辩 京 图 像 和 原 图 像 的 关系 映射 回 原 图 像 。 


7.3 FRAR: 基于 MDA |( 模型 驱动 构 案 ) 的 图 像 处 理 


模型 驱动 开 必 思想 概述 


基于 模型 设计 方法 是 一 种 设计 复杂 系统 的 可 视 化 数学 方法 。 基 于 模型 的 软件 开发 方法 是 
一 种 以 模型 为 中 心 的 软件 设计 方法 ， 用 模型 来 形式 化 表示 用 户 所 构建 系统 的 功能 、 行 为 和 结 
构 ， 形 陈 化 的 意思 是 摘 述 模型 的 语言 具有 定义 民 好 的 语法 和 语义 。 基 于 模型 设计 思想 是 通过 
模型 抽象 和 摘 述 系统 的 关键 问题 ， 用 模型 表示 出 系统 解决 方案 ， 并 通过 形式 化 的 工具 对 系统 
模型 进行 验证 以 保证 系统 设计 正确 性 。 基 于 模型 设计 思想 从 根本 上 解决 了 软件 设计 的 正确 性 
保证 问题 。 

什么 是 模型 ? 模型 可 以 是 具体 的 物理 实体 ， 也 可 以 是 抽象 的 描述 〈 如 图 像 描述 、 数 
学 表达 式 )。 模 型 特征 是 对 对 应 的 物理 系统 或 者 非 物 理 系 统 的 一 种 简化 表示 ， 是 人 们 的 一 
种 有 意识 的 创造 物 。 有 了 模型 ， 系 统 开 发 人 员 就 可 以 依据 模型 来 构建 系统 ， 而 忽略 掉 无 
天 的 细节 。 

系统 建 模 和 模型 仿真 验证 是 基于 模型 设计 方法 的 两 个 重点 。 采 用 特定 的 建 模 语 言 和 模型 
设计 工具 来 抽象 出 被 描述 的 目标 系统 ， 从 而 建立 准确 的 模型 ， 这 样 可 以 消除 其 他 系统 描述 方 
去 《比如 文本 摘 述 ) 的 模糊 性 和 二 义 性 。 仿 真 验证 ， 室 无 疑问 需要 基于 建立 好 的 、 谁 确 的 目 
标 模 型 ， 而 仿真 验证 融 来 的 好 处 是 通过 相应 的 仿真 验证 工具 对 模型 进行 仿真 验证 之 后 可 以 保 
证 模型 的 正确 性 。 

模型 有 驱动 架构 (Model Driven Architecture, MDA) 是 于 2002 年 被 所 出 的 ， 包 含 了 模型 的 
精确 形式 化 表示 、 模 型 存储 以 及 模型 交换 每 方面 的 一 系列 规约 ， 如 MOF (Meta Object 
Facility), OCL (Object Constraint Language), XMI (XML Metadata Interchange) 55, Eft 
Tem WV BERE ERKENEK, HsbrmupfutrE. WM LTEBEZJAU n] 2 
护 性 。 要 求 设 计时 进行 严格 的 模型 定义 ， 力 图 最 终 能 全 部 或 部 分 目 动 生成 工程 代码 。 

MDA 的 软件 开发 过 程 是 由 软件 系统 建 模 驱 动 的 。 模 型 根据 抽象 层次 不 同 可 分 为 平台 无 
天 模型 PIM 和 平台 相关 模型 PSM。 平 台 无 关 模 型 描述 系统 的 行为 需求 不 涉及 平台 实现 细 
人 节 ， 平 台 无 天 模型 的 设计 者 专注 于 表示 系统 的 业务 逻辑 。 平 台 相 关 模 型 不 仅 包 含 系统 功能 描 
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述 而 且 包 含有 实现 平台 的 设计 思想 。 平 台 无 关 模 型 可 以 家 转换 为 一 个 或 多 个 平 侣 相关 模 
型 ， 最 终 会 转换 成 具体 平台 的 实现 代码 。MDA 软件 开发 周期 如 图 7-7 所 示 。 


人 -全 -人 -全 全 全 


图 7-7 MDA 软件 开发 周期 














MDA 引入 了 模型 驱动 开发 (Model-Driven Development, MDD) 模型 集成 运算 CModel- 














模型 集成 运算 开 友 方法 是 面向 领域 的 模型 驱动 开发 方法 ， 在 面向 特定 领域 的 建 模 语言 方面 扩 
展 了 模型 驱动 开发 方 法 ， 能 通过 元 异型 针对 特定 领域 进行 定制 和 裁 角 ， 并 能 基于 领域 模型 的 
目 动 生成 代码 。 

代码 生成 的 概念 最 初 匈 于 纺 详 需 设 计 和 开 及 中 ， 编 详 需 先 将 输入 的 源 程 序 翻 详 成 人 种 中 
间 表 示 ， 然 后 产生 等 价 的 某 种 目标 程序 语言 表示 的 目标 程序 。 这 种 将 中 间 表 示 生 成 目标 程序 
的 过 程 也 是 代码 生成 ， 但 是 在 基于 模型 的 软件 设计 方法 中 的 代码 生成 是 指 利用 计算 机 程序 
《代码 生成 器 ) 将 模型 自动 的 生成 可 用 的 代码 。 代 码 生成 的 过 程 大 致 包括 模型 建立 和 生成 代 
人 码 。 建 立 一 个 好 的 能 准确 描述 应 用 系统 并 充分 若 碟 系统 应 用 环境 的 模型 不 能 解决 所 有 问题 ， 
因为 有 必要 将 这 个 模型 转化 成 有 效 的 可 运行 的 模型 代码 。 

基于 模型 的 软件 开发 方法 和 传统 的 软件 开 友 方法 有 看 显得 的 区 别 : 传统 的 软件 开发 方 
ik. WWE 7-8 所 示 ， 其 核心 是 代码 ， 代 人 码 的 开发 、 测 试 和 维护 占用 项 目 开 发 的 绝 大 多 数 时 间 
和 精力 。 而 基于 模型 的 软件 开发 方法 ， 如 图 7-9 所 示 ， 其 核心 是 模型 ， 项 目 开 发 的 主要 工作 
古 模型 的 设计 ， 测 试 和 维护 也 古 围 绕 看 模型 来 开展 的 ， 而 代码 可 以 方便 地 依据 模型 而 目 动 生 
成 。 代 码 生成 可 以 很 好 地 提升 软件 开发 效率 、 绽 短 软件 开 友 周期 。 

































































图 7-8 传统 的 以 代码 为 中 心 的 软件 开发 方法 图 7-9 ”以 模型 为 中 心 的 软件 开发 方法 


732. 模型 驱动 开发 的 优势 | 


基于 模型 驱动 的 设计 开发 在 各 个 过 程 之 间 没 有 阻碍 ， 它 的 优势 在 于 : 

(1) 在 统一 的 开发 、 测 试 平台 上 ， 人 允许 产品 从 需求 分 析 阶 段 束 开始 验证 ， 并 做 到 持续 不 
汤 的 验证 与 测试 。 

(2) 产品 的 缺陷 雄 露 在 产品 开 肥 的 初级 阶段 ， 开 发 者 把 主要 精力 放 在 算法 和 测试 的 研究 
上 ， 代 码 生 成 和 验证 过 程 则 留 给 计算 机 去 目 动 完 成 。 
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(3) 大 大 缩短 开发 周期 ， 降 低 开 发 成 本 。 


模型 驱动 开发 在 图 像 处 理 领 域 中 的 应 用 


众所周知 ， 数 字 图 像 处 理 的 实现 过 程 中 代码 量 巨大 ， 将 模型 驱动 开发 引入 到 图 像 处 理 领 O) 
域 ， 可 大 大 提高 其 规范 性 和 高 效 性 。 

基于 模型 驱动 的 数字 图 像 处 理 的 主要 步骤 包括 。 

(1) 需求 分 析 。 

(2) 将 实现 过 程 按照 逻 铀 先后 顺序 分 为 各 个 阶段 ， 再 将 各 个 阶段 按照 功能 划分 为 各 个 模 
5. 











(3) 建立 基于 功能 模块 的 模型 ， 并 进行 仿真 。 
(4) 代码 目 动 生成 。 


"KW 基于 Simulink-Blocks 的 模型 驱动 开发 图 像 处 理 





MATLAB 中 的 计算 机 视觉 系统 工具 箱 (Computer Vision System) 如 图 7-10 所 示 ， 它 提 
供 了 视频 和 图 像 处 理 的 各 种 模型 ， 共 计 11 个 大 类 库 ， 每 个 模型 库 提供 了 数 种 模块 。 用 户 可 
以 通过 拖 动 、 组 合 ， 构 建 视频 和 图 像 处 理 模型 ， 进 行 视频 和 图 像 的 仿真 和 分 析 。 


YE d. Aerospace 
File Edit Debug Para $ Bioinformatics 


: r) c1 | X Ba Fe 4h. Communications System 
i C REA Computer Vision System 
4 Control System 
A Curve Fitting 
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PE] aeployteol. bat 4h Financial Derivatives 
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图 7-10 计算 机 视觉 系统 工具 箱 的 路 竹 








Hz) MATLAB, ， 单 击 界 面 左下 角 的 Start 按钮 ， 选 择 Toolboxes>Computer Vision 
System->Block Library 命令 ， 系 统 束 会 载 入 视频 和 图 像 处 理 柑 块 工具 箱 ， 如 图 7-11 所 示 。 
视频 和 图 像 处 理 模块 包含 Sources HAER), Sinks GAHE), Analysis & Enhancement 
(分 析 和 增强 )、Conversions (转换 )、Filtering (滤波 )、Geometric Transformations 〈 儿 何 变 









MATLAB szmgssszkz NENNEN 





155. Morphological Operations〈 形 态 学 运算 )、Statics (统计 )、Text & Graphics (文本 和 图 
像 )、Transforms 〈 变 换 ) 和 Utilies CE XE XO. 等 共 11 个 大 类 库 。 这 几乎 包含 了 图 像 处 理 中 
的 所 有 操作 和 算法 ， 并 附带 了 文字 标注 子 模块 ， 为 图 像 处理 的 模型 建立 和 仿真 提供 了 充足 
的 模块 。 





[7] Library: viplibvi 
File Edit View Format H 


MA | SPE (à 
2 o HH 


Sources i Analysis & Conversions 
Enhancement 


Filtering Geometric Morphological Statistics 
Transformations Operations 


A L 


Text & Graphics Transforms Utilities 


Demos Info 


Video and Image Processing Blockset 3.0 


Copyright 2004-2010 The Mathworks, Inc. 





E 7-11 视频 和 图 像 处 理 模 块 





下 面 通 过 一 个 例子 来 描述 如 何 通 过 MATLAB Simulink-Blocks 来 实现 基于 模型 驱动 的 数 
"E ERAT, 

(1) 需求 分 析 。 对 输入 的 图 像 进行 Sobel 边缘 检测 。 

(2) 实现 步 又。RGB 图 像 输入 一 转换 成 灰 度 图 像 一 边缘 提取 。 

(3) 建立 功能 模块 ， 并 通过 功能 模块 进行 仿真 。 

其 中 ， 各 功能 模块 及 其 路 径 如 表 7-2 所 示 ， 连 接 方 式 如 图 7-12 所 示 。 

表 7-2 各 功能 模块 及 其 路 径 
功 ” 能 £ 称 路 径 


读 入 图 像 Image From File Computer Vision System/Block Library/Sources 


色彩 空间 转换 Color Space Conversion Computer Vision System/Block Library/Conversions 


边缘 检测 Edge Detection Computer Vision System/Block Library/Analysis&Enhancement 
观察 输出 结果 Video Viewer Computer Vision System/Block Library/Sinks 
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[z] so0belcode 
Eile Edit View Simulation Format Tools Help 


Dig belete 





bp m foo [Norma -mumes.-t:ume 


peppers.png Image i Vide | Sobel Edgè 


Image From File Color Space Edge Detection 
Conwaerzion 











Video Viewer 


图 7-12 ”基于 模型 驱动 的 Sobel 边缘 检测 


对 各 模块 的 属性 进行 如 下 设置 。 
1) 双击 Image From File 模块 ， 其 参数 设置 如 图 7-13 Bran 


[Z] Source Block Parameters: Image From File 区 | 
^ Image From File 

Reads an image from a file. 

Use the File name parameter to specify the image file 


you want to import into your model. Use the Sample time 
parameter to set the sample period of the block. 








r^ Parameters * 
File name: peppers. png 
Sample tine: 


Image signal: One multidimensional signal 





Le [ &miy | 
图 7-13 Image From File 模块 参数 设置 


2) 双击 Color Space Conversion 模块 ， 其 参数 设置 如 图 7-14 所 示 。 


最 Function Block Parameters: Color Space Conv... fx] 
-Color Space Conversion (mask) (link) 


Converts color information between color spaces. 


All conversions support double-precision floating-point 
and single-precision floating-point inputs. The 
conversions from R'G'B' to intensity and between the 
R'G'B' and Y CbCr color spaces also support 8-bit 
unsigned integer inputs. 


—Parameters 
Conversion: HMM 


Image signal: |Üne multidimensional signal 





Lor jLeaeel J[ Help ] ariy | 


图 7-14 Color Space Conversion 模块 参数 设置 





MATLAB x*s4x: 








3) 双击 Edge Detection 模块 ， 其 参数 设置 如 图 7-15 Bros. 


E Function Block Paraneters: Edge Detection 
- Edge Detection 
Finds the edges in an input image using Sobel, Prewitt, Roberts, or Canny methods. 
Ihe block outputs a binary image, a matrix of Boolean values, where pixel values equal to 1 


correspond to edges. Alternatively, the block can output two gradient components of the image 
for the first three methods. 


| Main || Data Types | 


Parameters 


Method: |Sobel q 


Output type: 
O User-defined threshold 
Threshold scale factor: 


[]Edge thinning 





Lo Lemcer jjLa ja | 


图 7-15 Edge Detection 模块 参数 设置 








在 完成 各 功能 模块 的 设置 之 后 ， 对 整个 模型 进行 仿真 ， 证 明 访 模型 是 正确 的 并 且 是 可 行 
的 ， 其 运行 效果 如 图 7-16 所 示 。 


= 小 Video Viewer 

File Tools View Simulation Help 

品名 Om AO S 
"up 





图 7-16 模型 仿真 结果 


(4) 代码 目 动 生成 
接 下 来 ， 进 行 代 公 的 目 动 生成 。 在 Simulation FM F, 64€ Configuration 
Parameters 命令 ， 如 图 7-17 所 示 。 
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| Format Tools Help 
Ctrl*T 


Conti guration Farameters CtrltE 


v Normal 
Accelerator 
Bapid Accelerator 
Software-in-the-Loop (SIL) 
Processor-in-the-Loop (FIL) 
External 





图 7-17 选择 Configuration Parameters 命令 


将 Solver options 的 属性 设置 为 Fixed-step， 如 图 7-18 所 示 。 


Bh, Configuration Parameters: sobelcode/Configuration (Active) 
: Simulation time 
Solve aea T 
Data Import/Export 


Solver optin 








-Madel Referencing 


4-Simulation Target Fixed-stsp size (fundamental sample tima): 


Code Generation 


EDL Code Generation 
Tasking and sample time options 


Periodic sample time constraint: 
Tasking mode for periodic sample times: Auto 
C Automatically handle rate transition for data transfer 

[]Higher priority value indicates higher task priority 


图 7-18 将 Solver options 的 属性 设置 为 Fixed-step 


里 击 Code Generation 下 的 Build 按钮 ， 如 图 7-19 所 示 ， 便 可 生成 可 执行 的 C fxh, AN 
图 7-20 所 示 。 





Ss Configuration Parameters: szobelcode/Configuration (Active) 


-Target zelection 


System target file: 

m-Diagnostics 

Hardware Implementa...| ~ Build process 

Model Referenci ————— 
H-Simulatiaon Target Compiler optimization level: |Üptimizations off (faster builds) m 
T TLC options: LLLL_ | 
-Makefile configuration A 
[v] Generate makefile 

Make command: 
Template makefile: — |grt defmult taf | 


c-HDL Code Generation 


-Code Generation Advisor 
Select objective: Unspecified ~ 
Check model before generating code: Check model ... 


| []Generate code only 





图 7-19 单 击 Code Generation. 下 的 Build 按钮 








[Code Generation Report dl Im x| 


[Search File: sobelcode.c 


1 ,* 
Contents 2 * sobelcode.c 
3 LI 
summary 4 + Code generation for model "sobelcode", 
Subsystem Report 5 
6 + Model varsion £l. 
7 + Simulink Coder version : 8.2 (R2012a) 29-Dec-2011 
Generated Files 8 + C source code generated on : Thu Dec 22 11:03:44 2011 
5 
[7] Model files i0 * Target selection: grt.tlc 
sobelcode.c i1 * Note: GRT includes extra infrastructure and instrumentation for prototypi. 
12 + Embedded hardware selection: S3Z-bit Generic 
sobelcode.h. 13 + Code generation objectives: Unspecified 
sobelcode. private.h 14 + Validation result: Not run 
| 15 aa 
sobelcode types.h i6 #include "sobelcode.h" 
17 include "sobelcode private.h" 
[+] Utility files (7] i8 B 


19 /*" Real-time model */ 
20  RIJIODEL.zobelcode sobelcode BN: 
21  RIJMODEL sobelcode *const sobelcode M = &gobelcode M: 


[+] Interface files (1) 


[*] Other files (1) 


23  /* Model step function */ 
24 void sobelcode step(void) 


25 d 
26 /* Matfile logging */ 

27 rt.UpdateTlilLogVarsi(zobelcode M-»rtwLogInfo, (mobelcode H->Timing.t)): 
28 

29 /* Update absolute Lime for base rate */ 

50 /* Tha "clockTick0" counts tha number of Limes the code of this task has 


图 7-20 生成 的 可 执行 的 C 代码 


7.4 技巧 点 拨 : 仿生 理论 助力 图 像 处 理 技 术 发 展 


仿生 理论 与 图 像 处 理 技 术 相 结合 的 优势 








目前 ， 数 字 图 像 处 理 扩 术 已 在 航天 航空 、 科 学 探测 、 人 工 智 能 、 安 防 监控 等 领域 有 看 广 
阔 的 应 用 。 为 了 获得 更 好 的 功能 效 末 ， 除 了 采用 传统 的 设计 方法 以 外 ， 科 研 工作 者 把 目光 晓 
ETERA, 力求 从 丰富 多 彩 的 生物 里 上 获得 姑 感 。 因 此 ， 将 仿生 学 理论 与 现代 数 子 图 像 处 
理 技术 相 结合 已 成 为 一 个 重要 的 发 展 趋势 。 

仿生 学 正式 诞生 于 1960 年 9 月 由 闫 国 空 车 航空 局 在 俄 雍 俄 州 的 空军 基地 戴 通 召开 的 第 
一 次 仿生 学 会 议 上 ， 会 议 讨 论 的 中 心 议题 是 “分 析 生 物 系 统 所 得 到 的 概念 能 够 用 到 人 工 制造 
的 信息 加 工 系 统 的 设计 上 去 吗 ? ”斯 蒂 尔 将 这 门 新 兴 的 科学 命名 为 “Bionics”， 其 布 腊 文 的 
意思 代表 看 研究 生命 系统 功能 的 科学 。1963 年 我 国 将 “Bionics” 详 为 “仿生 学 ”。 斯 带 尔 把 
仿生 学 定义 为 “模仿 生物 原理 来 建造 搁 术 系统 ， 或 者 使 人 造 拉 术 系 统 上 共有 或 类 似 于 生物 特征 
的 科学 ”。 简 言 之 ， 仿 生 学 下 是 模仿 生物 的 科学 。 确 切 地 次 ， 仿 生 学 是 研究 生物 系统 的 结 
构 、 特 质 、 功 能 、 能 量 转换 、 信 息 控 制 等 各 种 优 卉 的 特征 ， 并 把 它们 应 用 到 技术 系统 、 改 善 
己 有 的 技术 工程 设备 ， 并 创造 出 新 的 工艺 过 程 、 建 筑 构 型 、 上 自动 化 装置 等 的 综合 性 科学 。 从 
生物 学 的 角度 来 说 ， 仿 生 学 属于 “应 用 生物 学 ”的 一 个 分 文 ， 从 工程 技术 方面 来 看 ， 仿 生 学 
根据 对 生物 系统 的 研究 ， 为 设计 和 建造 新 的 技术 设备 近 供 了 新 原 理 、 新 方法 和 新 途径 。 仿 生 
学 的 光荣 使 命 就 是 为 人 类 提供 最 可 靠 、 最 灵活 、 最 高 效 、 最 经 济 的 接近 于 生物 系统 的 技术 系 
统 ， 为 人 类 造福 。 
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仿生 理论 在 数字 图 像 处 理 领 域 的 应 用 主要 体现 在 如 下 方面 。 

> 利用 布谷 乌 算 法 解决 图 像 多 阔 什 分割 中 的 耗 时 问题 。 访 方法 的 思路 为 : 以 Otsu 法 设 
计 多 阔 值 分 割 的 适应 度 国 数 ， 并 利用 布谷 乌 算 法 找到 网 像 的 最 优 分 割 浆 值 。 

> 党 复眼 仿生 技术 。 针 对 海洋 动物 党 的 复眼，Hartline 等 人 曾 进行 了 长 达 40 多 年 的 研 他) 
究 工 作 ， 提 出 了 “ 侧 抑 制 野 ” 的 概念 。 侧 抑制 在 图 像 处 理 中 的 主要 功能 有 : COR 
测 图 像 的 边框 、 突 出 边缘 、 增 加 反差 @ 抑制 空间 低频 部 分 ， 相 当 于 高 通 滤波 器 ， 
将 较 大 的 输入 变化 范围 压缩 到 网 络 本 吴 的 动态 范围 之 内 ， 因 而 对 均匀 光照 起 到 之 度 
水 平 适 应 作用 ， 把 腕 度 适应 机 制 和 边框 突出 机 制 结合 起 来 ，@B) 对 屈 光 系 统 所 引起 的 
缺陷 的 成 像 模糊 进行 人 补偿， 使 模糊 的 图 像 又 重新 变 得 清晰 。 

> 晶 复 眼 仿生 技术 。 近 年 来 ， 昆 虫 的 视觉 机 理 一 直 是 许多 国家 的 视觉 研究 工作 者 热衷 
选择 的 一 个 重要 谍 题 ， 极 其 诱惑 性 和 挑战 性 。 这 是 因为 由 较 小 的 神经 元 组 成 的 昆虫 
视觉 系统 虽然 简单 ， 但 却 能 出 色 地 完成 视觉 检测 任务 ， 对 运动 的 检测 更 是 如 此 。 量 
作为 具有 神经 重 登 形 复 眼 且 能 快速 运动 的 双 刀 目 昆 虫 ， 能 高 效 、 实 时 地 对 运动 环境 
进行 感知 和 评估 。 在 蝇 复 眼 仿生 技术 的 研究 中 发 现 ， 量 复眼 视 党 系统 具有 近 360^ 的 
视 场 角 ， 其 视觉 的 最 大 特点 就 是 上 共有 大 场景 系统 和 小 场景 系统 两 个 并 行 信息 采集 处 
理 通道 。 大 场景 系统 获取 周边 大 环境 区 域 的 环境 特征 ， 控 制 其 飞行 路 线 ;， 而 小 场景 
系统 完成 目标 识别 与 跟踪 任务 。 

> 猫 视觉 皮层 仿生 。 哺 乳 动 物 的 视觉 信息 处 理 过 程 已 经 进化 到 高 度 完美 的 阶段 。 脉 冲 
灯 合 神经 网 络 (Pulse Coupled Neural Net, PCNN) 是 由 Eckhorn X fff EE Ait A Ji 2A At 
皮层 中 实验 所 观察 到 的 与 特征 有 关 的 神经 元 同步 行为 现象 而 提出 的 。PCNN 不 同 于 传 
统 的 人 工 神 经 网 络 ， 它 是 一 种 单 层 神 经 网 络 模 型 ， 适 合 于 实时 图 像 处 理 环境 。 目 
前 ，PCNN 已 经 广泛 应 用 于 图 像 滤波 、 图 像 融 合 、 目 标 检 测 与 识别 及 网 像 分 割 等 领 
域 。 当 用 于 图 像 分 割 时 ，PCNN 不 同 于 传统 神经 网 络 模型 的 是 ， 它 不 需要 训练 束 可 实 


现 分 割 。 



















































































实例 分 析 : 猫 视觉 皮层 仿生 的 图 像 分 家 








近年 来 ， 基 于 PCNN 已 被 广泛 应 用 于 图 像 平 滑 、 分 割 以 及 边缘 检测 等 图 像 处 理 领 域 的 研 
究 中 并 显示 了 其 优越 性 。 
PCNN 的 数学 方程 描述 为 : 
F,(n)-e *^F,(n-1)- S; +V  MaY,(n-1) 
k,l 





L,(n) 2e "^L, (n-1) V, 3 M uYa(n-1) 
k,l 


U, (n)=F; (n)(1 * BL; (n) 
(n)=e ^8, (n-1)* V;Y, (n-1) 


Y, (n) =step(U, (n) - (n) 
其 中 ， 消 为 神经 元 的 标号 ; SS. Fo. Lo. Uy. GTa ARA i KARAR Tonus 


ij ij ij 


ANN. EBEN. Ps CBUBUOSANSSO. zB: MN DENER; V. V. 


0 


ij 
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V,XUMRHENOÉGS BOUREBURG ap 、w a 为 相应 的 衰减 系数 ， A DERS nE 
次 数 ， 世 为 输出 。 

在 用 PCNN 进行 图 像 分 割 时 ， 将 一 个 二 维 PCNN 网 络 M x N 的 个 神经 元 分 别 与 二 维 输 
入 图 像 的 Mx N 个 像素 相对 应 ， 像 素 六 的 灰 度 值 为 网 络 神经 元 站 的 外 部 刺激 5S, ， 且 所 有 神 
经 元 的 初始 值 设 为 1 。 则 在 第 一 次 迁 代 时 ， 神 经 元 的 内 部 激活 U O 就 等 于 外 部 刺激 5,， 若 








后 随时 间 指 数 豪 减 。 在 此 之 后 的 各 次 欠 代 之 中 ， 点 火 的 神经 元 会 通过 与 相 邻 神经 元 的 相互 连 
接 作 用 诅 励 邻接 的 神经 元 ， 知 邻接 神经 元 的 内 部 激活 大 于 等 于 闭 值 则 发 生 被 捕获 点 火 ， 显 
然 ， 大 邻接 神经 元 与 前 一 次 达 代 点 火 的 神经 元 所 对 应 的 像素 具有 相似 强 硫 ， 则 邻接 神经 元 容 























易 被 捕获 点 火 ， 反 之 不 能 够 被 捕获 点 火 。 因 此 ， 任 何 一 个 神经 元 的 自然 点 火 都 会 触发 其 邻接 
相似 神经 元 的 集体 点 火 ， 这 些 点 火 的 神经 元 形成 一 个 神经 元 集群 对 应 于 图 像 中 具有 相似 性 质 


的 一 个 小 区 域 。 因 此 ， 利 用 PCNN 点 火 捕 获 的 相似 性 集群 特性 便 可 进行 图 像 分 割 |。 

例 程 7-1 是 运用 PCNN 算法 进行 图 像 分 割 的 MATLAB 源 程 序 ， 运 行 结果 如 图 7-21 
Fr. 

例 程 7-1 





obELLLLLLLELLELLELLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL 


function [Edge,Numberofaera |-penn(X) 
% 功能 : 采用 PCNN 算法 进行 边缘 检测 
% 和 输入: X 一 输入 的 灰 度 图 像 


% 输出 : Edge 一 检测 到 的 Numberofaera 一 表明 了 在 各 次 从 代 时 油 活 的 块 区 域 
figure(1); 
imshow(X); 


X-double(X); 

9o WEN 

Weight-[0.07 0.1 0.07;0.1 0 0.1;0.07 0.1 0.07]; 
WeightLI2-[-0.03 -0.03 -0.03;-0.03 0 -0.03;-0.03 -0.03 -0.03]; 
d-1/(1-sum(sum(WeightLI2))); 
%%%%%% 测 试 权 值 %%%%%% 

WelghtLI=[-0.03 -0.03 -0.03;-0.03 0.5 -0.03;-0.03 -0.03 -0.03]; 
d1=1/(sum(sum(WeightLI))); 
0/09/00/09/09/00/09/09/00/09/09/00/09/09/09/09/09/09/0 

Beta-0.4; 

Yuzhi-245; 

ATIRA Z 

Decay=0.3; 

[a,b]=size(X); 

V_T=0.2; 

% 门 限 值 

Threshold-zeros(a,b); 

S=zeros(a+2,b+2); 

Y=zeros(a,b); 

Vo r KIRE 








Firate—zeros(a,b); 


n=l; 
% 统 计 循 环 次 数 
count-0; 


Tempul —-zeros(a,b); 
Tempu2-zeros(a4*2,b7-2); 
%%%%%% 图 像 增强 部 分 %%%%%% 
Out-zeros(a,b); 
Out-uint8(Out); 
for 1=1:a 
for Jj=1:b 
if(i—1|j--1]|ir--a[j7-b) 
Out(,])-X(1,j); 
else 
H-2[X(1,-1) X(-1,) X(-1,j*1); 
X(jl)  X()  X(i*l) 
X(i*-1,j-1) XG+1,]) X(i+1,j+1)]; 
temp-dl *sum(sum(H.* WeightLI)); 
Out(1,]))-temp; 
end 
end 
end 
figure(2); 
imshow(Out); 
0/09/09/09/09/09/09/09/09/09/09/09/09/09/09/09/09/09/09/o 
for count-1:30 
for 10-2:a*1 
for 11=2:b+1 
V-[S(10-1,1-1) S(10-1,11) S(10- 1,111); 
S(1041-1)  S(1041) JS(10,1-1); 
S(107-1,11-1) S(107-1,11) S(10—1,11-1)]; 
L-7sum(sum(V.* Weight)); 
V2-[Tempu2(10-1,11-1) Tempu2(10-1,i11) Tempu2(10-1,11--1); 
Tempu2(10,11-1) — Tempu2(i0j1l) —Tempu2(10,11—1); 
Tempu2(107-1,11-1) Tempu2(10—1,11) Tempu2(107-1,1171)]; 
F-X(10-1,11 -1)*sum(sum(V2.* WeightLI2)); 
% 你 证 侧 抑制 图 像 无 能 量 损失 
F-d*F; 
U-double(F)*(1-Beta*double(L)); 
Tempul(10-1,11-1)-U; 
if U»-Threshold(10-1,11-1)| Threshold(10-1,11-1)«60 
T(10-1,11-1)71; 
Threshold(i0-1,11—-1)-Yuzhi; 
% 点 火 后 一 百 置 为 1 
Y(10-1,11-1)71; 
else 
T(10-1,11-1)-0; 
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Y(10-1,11-1)-0; 
end 
end 
end 
Threshold-exp(-Decay)*Threshold* V T*Y; 
% 补 激活 过 的 像素 不 再 参与 迭代 过 程 
if n==1 
S=zeros(a+2,b+2); 
else 
S=Bianhuan(T); 
end 
n-n*l; 
count-count-* 1; 
Firate-Firate- Y; 
figure(3); 
imshow(Y); 
Tempu2-Bianhuan(Tempul); 


Firate(find(Firate«10))-0; 
Firate(find(Firate»—10))-10; 
figure(4); 

imshow(Firate); 


Vo. 09/61" PRIX. %%%%%%% 
function Y—Jiabian(X) 
[m,n]-size(X); 

Y=zeros(m+2,n+2); 

for i=1:m+2 





for j=1:n+2 

if i-—1&j--1&j-—n42 
Y(4)-X(Lj- 1); 

elseif j271 &i——1 &i-—m42 
Y(14)-X6G-1,1); 

elseif i~=1&j==n+t2&i~=m+2 
YGJ=X(i-1,n); 

elseif 1—m72&j--1 &j~=n+2 
YGJ)=X(m,j-1); 

elseif i——1&j—— 
Y(14)-X(1); 

elseif i1==1 &j==n+2 
Y(14)-X(1,n); 

elseif i==(m+2)&j== 
YGJ)=X(m,1); 

elseif 1==m+2&]j==n+2 
YGJ)=X(m,n); 

else 
YGJSXG-1,j-1); 

end 











第 7 章 GESE 





end 
end 
9%69%69%0%090% 于 国 数 9%6%6%6909%0%6 
function Y-Bianhuan(X) E 
[m,n]-size(X); D | 
Y=zeros(m+2,n+2); 
for i=1:m+2 
for j=1:n+2 
if 1—1[j—1|[i-—7m42 j77n*2 
Y(1j)-0; 
else 
Y(i)-XQ- Lj 1); 
end 
end 
end 
%%%%%% T P T /09/99/09/09/69/0 
function Y=judge edge(X,n) 
VeX: BERII PCNN 输出 的 三 值 图 像 ， 如 何 准确 判断 边界 点 是 关键 
[a,b |-size( X); 
T-Jiabian(X); 
Y —zeros(a,b); 
W-zeros(a,b); 
for i1=2:a+1 
for j-2:b*1 
if (TG) D &(T(-1,j)0& T(i-1,j)0)(T(i,j-1)0& T(i,j--1) 0)(T(i-1,j-1)9 0& T (i 1,j4-1)—0)((T(i-1,j-1)— 


O& T(i-1,j--1)—0)) 


Y(i-1-1)77n; 
end 
end 


end 
KOK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K 





a) b) c) 
图 7-21 例 程 7-1 的 运行 结果 
a) 输入 的 原始 图 像 b) 图 像 增强 后 的 结果 o) 图 像 分 割 后 的 结果 
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附 录 


附录 A 常用 MATLAB 图 像 处理 指 令 功 能 语 


A 


1. applylut 
功能 : 在 二 进 制 图 像 中 利用 lookup 表 进 行 边 缘 操 作 
语法 : A-applylut(BW,lut) 


2. bestblk 

功能 : 确定 进行 块 操作 的 块 的 大 小 
语法 : 

siz = bestblk([m n],k) 

[mb,nb] = bestblk([m n],k) 


3. blkproc 
功能 : 实现 图 像 的 显 式 块 操作 
语法 : 


B = blkproc(A, [m n],fun) 

B = blkproc(A, [m n ],fun,P1,P2,...) 

B = blkproc(A,[m n],[mborder nborder],fun,...) 
B = blkproc(A,'indexed",...) 





4. brighten 

功能 : IRRE ERK HI) rs E 
语法 : 

brighten(beta) 


newmap = brighten(beta) 

newmap = brighten(map,beta) 
brighten(fig,beta) 

o. bwarea 

功能 : 计算 二 进 制 图 像 对 象 的 面积 
语法 : total = bwarea(BW) 

6. bweuler 


功能 : 计算 二 进 制图 像 的 欧 拉 数 





法 索引 











语法 : eul = bweuler(BW,n) 

7. bwfill 

功能 : 填充 二 进 制 图 像 的 背景 
语法 : 

BW2 = bwfill(BW 1l,c,r,n) 

BW2 = bwfil(BW1,n) 

[BW2,idx] = bwfill(...) 

BW2 = bwfill(x,y,BW1,xi,yi,n) 

[x V,BW2,idx,xiyi] = bwfill(...) 
BW2 = bwfill(BWI,'holes',n) 
[BW2,dx] = bwfill(BW I ,'holes',n) 
8. bwlabel 

功能 : 标注 二 进 制 图 像 中 已 连接 的 部 分 
语法 : 

L = bwlabel(BW,;n) 

[L,num] = bwlabel(BW,n) 

9. bwmorph 

功能 : TH XE ERER 
语法 : 

BW2 = bwmorph(BW 1,operation) 
BW2 = bwmorph(BW  operation,n) 
10. bwperim 

功能 : 计算 二 进 制 图 像 中 对 象 的 周 长 
语法 : BW2 = bwperim(BW 1,n) 

11. bwselect 

功能 : 在 二 进 制 图 像 中 选择 对 象 
语法 : 

BW2 = bwselect(BW 1 c,r,n) 

BW2 = bwselect(BW 1,n) 

[BW2,idx] = bwselect(...) 


12. cmpermute 

功能 : VRREEACABUE erp BIER CS 
语法 : 

[Ynewmap] = cmpermute(X,map) 
[Ynewmap] = cmpermute(X,map,index) 
13. cmunique 


功能 : frix C UR PITE RU PRUES SCEH CES LR 
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语法 : 

| Y,newmap] = cemunique(X,map) 

| Y,newmap] = cmunique(RGB) 

| Y,newmap] = cmunique(I) 

14. col2im 

功能 : 将 矩阵 的 列 重新 组 织 到 块 中 
语法 : 

A = col2im(B,[m nl,[mm nn],block type) 
A = col2im(B,[m n],[mm nn]) 

15. colfilt 

功能 : PHIR REETAN 
语法 : 

B = colfilt(A,[m n],block type,fun) 

B = colfilt(A,[m n|,block type,fun,P1,P2,...) 








B = colfilt(A,[m n],[mblock nblock],block type,fun,...) 


B = colfilt( A,indexed',...) 
16. colorbar 
功能 : 显示 颜色 条 
语法 : 

colorbar('vert') 
colorbar('horiz') 
colorbar(h) 

colorbar 

h = colorbar(...) 

17. conv2 

功能 : 进行 二 维 耸 积 操作 
语法 : 

C = conv2(A,B) 

C = conv2(hcol,hrow,A) 
C = convX(...,shape) 

18. convmtx2 

功能 : VETE ERARA RE 
语法 : 

T = convmtx2(H,m,n) 

T = convmtx2(H,[m n]) 
相关 命令 : conv2 

19. convn 
功能 : 计算 n 维 卷 积 
语法 : 





C = convn(A,B) 

C = convn(A,B,shape) 

20. corr2 

功能 : 计算 两 个 矩阵 的 二 维 相关 系数 
语法 : r= corr2(A,B) 





21. dct2 

功能 : 进行 二 维 离散 余弦 变换 
语法 : 

B = dct2(A) 

B = dct2(A,m,n) 

B = dct2(A,[m n]) 

22. dctmtx 

功能 : 计算 离散 余弦 变换 矩阵 
语法 : D = dctmtx(n) 

相关 命令 : dct2 

23. dilate 

功能 : 放大 二 进 制图 像 
语法 : 

BW2 = dilate(BW1,SE) 

BW2 = dilate(BWI,SE,alg) 
BW2 = dilate(BW ,SE,...,n) 
24. dither 

功能 : 通过 抖动 增加 外 观 颜色 分 辨 率 ， 转 换 图 像 
语法 : 

X = dither(RGB,map) 

BW = dither(I) 

25. double 

功能 : 转换 数据 为 双 精 度 型 
语法 : 

B = double(A) 


26. edge 

功能 : 识别 强度 图 像 中 的 边界 
语法 : 

BW = edge(I,'sobel') 

BW = edge(I,'sobel'ithresh) 














BW = edge(I,'sobel';thresh,direction) 
[BW,thresh| = edge(I,'sobel',...) 
BW = edgel(l,'prewitt') 

BW = edge(I,'prewitt'thresh) 

BW = edge(I,'prewitt'thresh,direction) 
[BW.thresh] = edge(I,'prewitt',...) 
BW = edge(I,'roberts') 

BW = edge(I,'roberts'thresh) 
[BW,thresh| = edge(L,'roberts',...) 
BW = edgel(l,'log') 

BW =edge(L log',thresh) 

BW = edge(1,'log',thresh,sigma) 
[BW,threshold] = edge(l,'log',...) 
BW = edge(I,'zerocross'thresh,h) 
[BW,thresh] = edge(l,'zerocross',...) 
BW = edge(l,'canny') 

BW =edge(L canny ,thresh ) 

BW = edge(l,'canny',thresh,sigma) 
[BW,threshold] = edge(l,'canny',...) 
2/. erode 

功能 :弱化 二 进 制图 像 的 边界 
语法 : 

BW2 = erode(BW1,SE) 

BW2 = erode(BW ,SE,alg) 

BW2 = erode(BW l,SE,...,n) 


28. fft2 
功能 : 进行 二 维 快速 传 里 叶 变 换 
语法 : 

B = fft2(A) 

B = fft2(A,m,n) 

29. fftn 

功能 : 进行 n 维 快速 傅 里 叶 变 换 
语法 : 

B = fftn(A) 

B = fftn(A,siz) 

30. fftshift 

功能 : EAER ETER 





移 到 光谱 中 心 











语法 : B = fftshift(A) 


31. filter2 
功能 : 进行 二 维 线性 过 滤 操 作 
语法 : 


B = filter2(h,A) 

B = filter2(h, A,shape) 

32. freqspace 

功能 : 确定 二 维 频率 啊 应 的 频率 空间 
语法 : 

[f1,£2] = freqspace(n) 

[f1,£2] = freqspace([m n]) 

[xl,y1] = freqspace(...,'meshgrid") 

f — freqspace(N) 

f= freqspace(N,' whole") 


33. freqz2 
功能 : 计算 二 维 频率 啊 应 
语法 : 


[H,f1,f2] = freqz2(h,n1,n2) 
[H,f1,f2] = freqz2(h,[n2 nl |) 
[H,f1,f2] = freqz2(h,f1,f2) 
[H,f1,f2] = freqz2(h) 

[...] = freqz2(h,...,[dx dy]) 

[...] = freqz2(h,...,dx) 
freqz2(...) 

34. fsamp2 

功能 : 用 频率 采样 法 设计 二 维 FIR 滤波 器 
语法 : 

h = fsamp2(Hd) 

h = fsamp2(f1,f2,Hd,[m n]) 
35. fspecial 

功能 : 创建 预定 义 的 滤波 可 
语法 : 

h = fspecial(type) 

h = fspecial(type,parameters) 
36. ftrans2 

功能 : 通过 频率 转换 设计 二 维 FIR 滤波 可 
语法 : 

h = ftrans2(b,t) 

h = ftrans2(b) 
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37. fwind1 
功能 : 用 一 维 窗口 方法 设计 二 维 FIR 滤波 器 
语法 : 


h = fwindl(Hd,win) 
h = fwindl(Hd,winl,win2) 
h = fwindl(fl,f2,Hd,...) 


38. fwind2 
功能 : 用 二 维 窗口 方法 设计 二 维 FIR 过 滤器 
语法 : 


h = fwind2(Hd,win) 
h = fwind2(f1,£2,Hd,win) 


39. getimage 

功能 :从 坐标 轴 取 得 图 像 数 据 
语法 : 

A= getimage(h) 

[X, V, A] = getimage(h) 

|... A.flag] = getimage(h) 

[...] = getimage 

40. gray2ind 

功能 : PERKE RBN RI KA 
WE:  [X,map]- gray2ind(1,n) 
41. grayslice 

功能 : 从 灰 度 网 像 创建 索引 图 像 
语法 : 

X = grayslice(ILn) 

X = grayslice(Lv) 


42. histeq 

功能 : 用 和 直方 图 均等 化 增强 对 比 
语法 : 

J = histeq(Lhgram) 

J = histeq(Ln) 

[J,T] = histeq(L...) 

43. hsv2rgb 

功能 : 转换 HSV 值 为 RGB 颜色 空间 
语法 : 








rgbmap = hsv2rgb(hsvmap) 
RGB - hsv2rgb(HSV) 


44. idct2 

功能 : VEL HEBSBUXRUASETR 
语法 : 

B = idct2(A) 

B = idct2(A,m,n) 

B = idc2(A,[m n]) 

45. ifft2 

功能 : E  HEDUETS E 2e 
语法 : 

B = ift2(A) 

B = iff2(A,m,n) 

46. ifftn 

功能 : 计算 n 维 快速 传 里 叶 反 变换 
语法 : 

B = ifftn(A) 

B = ifftn(A,siz) 

47. im2bw 

功能 : 转换 图 像 为 二 进 制图 像 
语法 : 

BW = im2bw(I,level) 

BW = im2bw(X,map,level) 

BW - im2bw(RGB,level) 

48. im2col 

功能 : 重 调 图 像 块 为 列 

语法 : 

B = im2col(A,[m n],block type) 

B = im2col(A,[m n]) 

B = im2col(A,'indexed',...) 

49. im2double 

功能 : FeR PEAN DO E70 
语法 : 

I2 = im2double(I1) 

RGB2 = im2double(RGB1) 

BW2 = im2double(BW1) 

X2 = im2double(X 1l ,;ndexed") 

















50. im2uint8 

功能 : 转换 图 像 阵列 为 8 位 无 符号 整 型 
语法 : 

I2 = im2uint8(11) 

RGB2 = im2uint8S(RGB1) 

BW2 = im2uint8S(BWI]) 

X2 = im2uint8(X ] ,;ndexed") 

51. im2uint16 

功能 : 转换 图 像 阵列 为 16 位 无 符号 整 型 
语法 : 

I2 = im2uintl16(I1) 

RGB2 = im2uintl (RGB) 

X2 = im2uint16(X]1,'indexed') 





02. imadjust 
功能 : 调整 图 像 灰 度 值 或 颜色 映像 表 
语法 : 


J = imadjust(L [low high],[bottom top],gamma) 
newmap = imadjust(map,[low high],[bottom top],gamma) 
RGB2 = imadjust(RGB],...) 


o3. imapprox 
功能 : 对 索引 图 像 进行 近似 处 理 
语法 : 


[Ynewmap] = imapprox(X,map,n) 
| Y,newmap] = imapprox(X,map,tol) 
Y = imapprox(X,map,newmap) 
[...] = imapprox(...,dither option) 
54. imcontour 

功能 : 创建 图 像 数据 的 轮廓 图 
语法 : 

imcontour(Ln) 

imcontour(I,v) 

imcontour(x,y,...) 
imcontour(...,LineSpec) 

[C)h] = imcontour(...) 

55. imcrop 

Dfe: BWER 

语法 : 

I2 = imcrop(I) 

X2 = imcrop(X,map) 











RGB2 - imcrop(RGB) 

I2 = imcrop(Lrect) 

X2 = imcrop( X,map,rect) 

RGB2 - imcrop(RGB,rect) 

[...] = imcrop(x,y....) 

[ A,rect] = imcropx...) 

[X, y, A,rect] = imcrop(...) 

o6. imfeature 

功能 : A ERK AIRES 
语法 : 

stats — imfeature(L,measurements) 
stats — imfeature(L,measurements,n) 
57. imfinfo 

功能 : 返回 图 形 文件 信息 
语法 : 

info = imfinfo(filename,fmt) 

info — imfinfo(filename) 

58. imhist 

功能 : 显示 图 像 数 据 的 柱状 图 
语法 : 

imhist(I,n) 

imhist(X,map) 

[counts,x] = imhist(...) 

59. immovie 

功能 : MESMER | EL] ELA uU 
语法 : mov = immovie(X,map) 
60. imnoise 

功能 :增加 图 像 的 演 染 效果 
语法 : 

J = imnoise(Ltype) 


J = imnoise(Ltype,parameters) 


61. impixel 
功能 : 确定 像素 颜色 值 
语法 : 


P= impixel(T) 

P = impixel( X,map) 
P= impixel(RGB) 

P = impixel(Lc,r) 

P = impixel(X,map,c,r) 














P = impixel(RGB,c,r) 
[c,r,P] = impixel(...) 


P = impixel(x,y,Lxi,yi) 

P = impixel(x,y, X,map,xi,yi) 
P = impixel(x,y,RGB,x1,y1) 
[xu yi,P] = impixel(x,y,...) 


62. improfile 
功能 : WET E RRE 
语法 : 


c — improfile 

c — improfile(n) 

c — improfile(Lxi,yi) 

c = improfile(Lxi,yi,n) 
[cx,cy,c] = improfile(...) 
[cx,cy,c,xi,yi] = improfile(...) 
[...] = improfile(x,y,Lxi,y1) 
[...] = improfile(x,y,Lxi,yi,n) 


63. imread 
功能 :从 图 形 文 件 中 读 取 图 像 
BE: 


A = imread(filename,fmt) 

[X,map] = imread(filename,fmt) 

[...] = imread(filename) 

[...] = imread(...,idx) (TIFF only) 

[...] = imread(...,ref) (HDF only) 

[...] = imread(...,'BackgroundColor',BG) (PNG only) 
[A,map,alpha] = imread(...) (PNG only) 
64. imresize 

功能 : 改变 图 像 大 小 

语法 : 

B = imresize(A,m,method) 

B = imresize(A,[mrows ncols],method) 
B = imresize(...,method,n) 

B = imresize(...,method,h) 

65. imrotate 

功能 : 旋转 图 像 

语法 : 

B = imrotate( A,;angle,method) 

B = imrotate( A,angle,method,'crop") 











66. imshow 

功能 : 显示 图 像 

语法 : 

imshow(Ln) 

imshow(L[low high]) 

imshow(BW) 

imshow(X,map) 

imshow(RGB) 

imshow(...,display option) 
imshow(x,y,A,...) 

imshow filename 

h = imshow(...) 

67. imwrite 

功能 : 把 图 像 写 入 图 形 文件 中 
语法 : 

imwrite(A,filename,fmt) 

imwrite( X,map,filename,fmt) 
imwrite(...,filename) 
imwrite(...,Paraml , Vall ,Param2, Val2...) 
68. ind2gray 

功能 : 把 检索 图 像 转化 为 灰 度 图 像 
语法 : 

I = ind2gray( X,map) 

69. ind2rgb 

功能 : 转化 索引 图 像 为 RGB 真 彩 图 像 
语法 : RGB = ind2rgb(X,map) 

70. iptgetpref 

功能 : 获取 图 像 处 理工 具 箱 参数 设置 
语法 : value = iptgetpref(prefname) 
71. iptsetpref 

功能 : 设置 图 像 处 理工 具 箱 参 数 
语法 :  iptsetpref(prefname,value) 
7/2. iradon 

功能 : BÍTA Radon 变换 

语法 : 

I = 1radon(P,theta) 

I = iradon(P,theta,interp,filter,d,n) 
[Lih] = iradon(...) 
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73. isbw 

功能 : 判断 是 否 为 二 进 制 图 像 
语法 : flag = isbw(A) 

T4. isgray 

功能 : 判断 是 否 为 灰 度 图 像 
语法 : flag = isgray(A) 

75. isind 

功能 : 判断 是 否 为 索引 图 像 
语法 : flag = isind(A) 

76. isrgb 

功能 : 判读 是 否 为 RGB 真 彩 图 像 
语法 : flag = isrgb(A) 





77. makelut 

功能 : 创建 一 个 用 于 applylut 函数 的 lookup 表 
语法 : 

lut = makelut(fun,n) 

lut = makelut(fun,n,P1,P2,...) 
78. mat2gray 

功能 : 转化 矩阵 为 灰 度 图 像 
语法 : 

I = mat2gray(A,[amin amax]) 
I=mat2gray(A) 

79. mean2 

功能 : 计算 矩阵 元 素 的 平均 值 
语法 : b = mean2(A) 

80. medfilt2 

功能 : 进行 二 维 中 值 滤波 
语法 : 

B = medfil2(A,[m n]) 

B = medfil2(A) 

B = medfilt2(A,'indexed',...) 

81. montage 

功能 : EIEH P H os tes AUR 
语法 : 

montage(I) 

montage(BW) 


montage( X,map) 

















montage(RGB) 
h = montagec(...) 


82. nlfilter 
功能 : 进行 边缘 操作 
UE: 


B = nlfilter(A,[m n],fun) 

B = nlfilter(A,[m n],fun,P1,P2,...) 

B = nlfilter(A,'indexed',...) 

83. ntsc2rgb 

功能 : 转换 NTSC 的 值 为 RGB WEZ M 
语法 : 

rgbmap = ntsc2rgb(yiqmap) 

RGB - ntsc2rgb(YIQ) 


84. ordfilt2 
功能 : 进行 二 维 统计 顺序 过 波 
BE: 


B = ordfilt2(A,order, domain) 
B = ordfilt2(A,order,domain,S) 
B = ordfilt2(...,padopt) 


85. phantom 
功能 : 产生 一 个 头 部 幻影 图 像 
语法 : 


P = phantom(def,n) 

P = phantom(E,n) 

[BE] = phantom(...) 

86. pixval 

功能 :显示 图 像 像素 信息 
语法 : 

pixval on 

pixval off 

pixval 


pixval(fig,option) 
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87. qtdecomp 

功能 : 进行 四 叉 树 分 解 

语法 : 

S = qtdecomp(I) 

S = gqtdecomp(Lthreshold) 

S = gqtdecomp(Lthreshold,mindim) 

S = qtdecomp(1,threshold, [mindim maxdim]) 

S = qtdecomp(Lfun) 

S = gqtdecomp(Lfun,P 1,P2,...) 

88. qtgetblk 

功能 : 获取 四 又 树 分 解 中 的 块 值 

语法 : [vals,r,c] = qtgetbIk(LS,dim) 
[vals,idx| = qtgetbIk(I,S,dim) 

89. gtsetblk 

功能 : 设置 四 又 树 分 解 中 的 块 值 

语法 : J= qtsetblk(1,S,dim,vals) 


90. radon 

功能 : 计算 Radon 变换 
语法 。 

R = radon(Ltheta) 

R = radon(Ltheta,n) 
[R,xp] = radon(...) 

91. rgb2gray 








功能 : 转换 RGB 图 像 或 颜色 映像 表 为 灰 度 图 像 


EYE : 

I = rgb2gray(RGB) 

newmap - rgb2gray(map) 

92. rgb2hsv 

功能 : 转化 RGB A HSV AIEA IR] 
VH PR : 

hsvmap - rgb2hsv(rgbmap) 

HSV - rgb2hsv(RGB) 





93. rgb2ind 

功能 : 转化 RGB 图 像 为 索引 图 像 
语法 : 

[X,map] = rgb2ind(RGB,tol) 

[X,map] = rgb2ind(RGB,n) 

X = rgb2ind(RGB,map) 

[...] = rgb2ind(...,dither option) 

94. rgb2ntsc 

功能 : 转化 RGB 的 值 为 NTSC tt^ ^ Ih] 
语法 : 

yiqmap = rgb2ntsc(rgbmap) 

YIQ = rgb2ntsc(RGB) 

95. rgb2ycbcr 

功能 : 转化 RGB 的 值 为 YcbCr 颜色 空间 
语法 : 

ycbcrmap = rgb2ycbcr(rgbmap) 

YCBCR = rgb2ycbcr(RGB) 

96. rgbplot 

功能 : 划分 颜色 映像 表 

语法 : rgbplot(map) 





97. roicolor 
功能 : 选择 感 兴 趣 的 闫 色 区 域 
语法 : 


BW = roicolor(A,low,;high) 
BW = roicolor(A,v) 


98. roifill 
功能 : 在 图 像 的 任意 区 域 中 进行 平滑 插 补 
BE: 


J = roifill(Lc,r) 

J = roifill(T) 

J = roifill(L,;BW) 

[J,BW] = roifill(...) 

J = roifill(x,y,Lxi,y1) 
[x,y,],BW,xi,yi] = roifill(...) 
99. roifilt2 
功能 : EJER X ik 
语法 : 
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J = roifilt2(h,L, BW) 
J = roifil(LBW,fun) 
J = roifilt2(1,BW,fun,P 1,P2,...) 


100. roipoly 
功能 :选择 一 个 敏感 的 多 边 形 区 域 
语法 : 


BW = roipoly(Lc,r) 

BW = roipoly(I) 

BW = roipoly(x,y,Lxi,yi) 
[BW,xi,y1| = roipoly(...) 
[X,y,BW,x1,y1| = roipoly(...) 


101. std2 

功能 : 计算 矩阵 元 素 的 标准 工 
语法 : b= std2(A) 

102. subimage 

功能 : 在 一 幅 图 中 显示 多 个 图 像 
语法 : 

subimage(X,map) 








subimage(I) 
subimage(BW) 
subimage(RGB) 
subimage(x,y,...) 


h = subimage(...) 


103. truesize 

功能 : 调整 图 像 显 示 尺 十 
语法 : 

truesize(fig,[mrows mcols]) 





truesize(fig) 


104. uint8 

功能 : 转换 数据 为 8 位 无 符号 整 型 
语法 : B = uint8(A) 

105. uint16 

功能 : 转换 数据 为 16 位 无 符号 整 型 








语法 : I-uintl6(X) 


106. warp 

功能 : EE S PAEK TI 
语法 : 

warp(X,map) 

warp(Ln) 

warp(BW) 

warp(RGB) 

Warp(Z,...) 

warp(X,y,Z,...) 

h = warp(...) 

107. wiener2 

功能 : 进行 二 维 适 应 性 去 噪 滤波 处 理 
语法 : 

J = wiener2(L [m n],noise) 


[J noise] = wiener2(L [m n]) 


108. ycbcr2rgb 

功能 : 转化 YcbCr 值 为 RGB HiT T) 
语法 : 

rgbmap = ycber2rgb(ycbcrmap) 

RGB = ycber2rgb( Y CBCR) 


109. zoom 
功能 : 缩放 图 像 
语法 : 

Zoom on 
zoom off 
Zoom out 
Zoom reset 
Zoom 

Zoom xon 
Zoom yon 
zoom(factor) 


zoom(fig,option) 
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附录 B 系统 对 象 功 能 汇总 

















系统 对 象 名 称 Ij 能 
视频 显示 
vision.DeployableVideoPlayer 在 计算 机 屏幕 上 显示 视频 
vision.VideoPlayer 播放 视频 或 显示 图 像 序列 
视频 读 写 
vision.BinaryFileReader 读 入 二 进 制 视频 文件 
vision.BinaryFileWriter 将 二 进 制 视频 写 入 文件 
vision.VideoFileReader 从 文件 中 访 取 视频 
vision.VideoFileWriter 将 视频 写 入 文件 
特征 检测 、 提 取 与 匹配 
vision.BoundaryTracer 跟踪 二 值 图 像 中 物体 的 边缘 
vision.CornerDetector 角 点 检测 
vision.EdgeDetector 边缘 检测 
目标 检测 
vision.CascadeObjectDetector 采用 Viola-Jones 算法 检测 目标 
运动 分 析 与 跟踪 
vision.BlockMatcher 基于 块 匹 配 的 运动 估计 
vision.ForegroundDetector 基于 高 斯 混合 模型 的 背景 检测 
vision.HistogramBasedTracker 基于 直方 图 特征 的 目标 跟踪 
vision.OpticalFlow 基于 光 流 法 的 物体 运动 速度 估计 
vision.TemplateMatcher 基于 模板 匹配 的 目标 定位 
分 析 与 增强 
vision.ContrastAdjuste 对 比 度 调 整 
vision.Deinterlacer 消除 运动 伪 影 的 隔行 扫描 视频 信号 输入 
vision.HistogramEqualizer 采用 直方 图 均衡 法 增强 对 比 度 
vision.MedianFilter 2-D 中 值 滤波 
图 像 转换 
vision.Autothresholder 采用 目 动 阔 值 法 转换 成 二 值 图 像 
vision.ChromaResampler 降低 采样 紊 或 样品 色 度 分 量 图 像 
vision.ColorSpaceConverter 色彩 空间 转换 
vision.DemosaicInterpolator 将 Bayer Ei E UE HO RIERREN 
vision.GammaCorrector Gamma 校正 
vision.ImageComplementer 求 图 像 的 补 图 
vision.ImageDataTypeConverter 图 像 数 据 类 型 转换 
integralKernel 积分 图 像 滤波 
vision.Convolver 用 于 计算 两 个 矩阵 的 离 获 卷 积 
vision.ImageFilter 对 图 像 采 用 输入 的 矩阵 对 其 滤波 
vision.MedianFilter 对 输入 的 图 像 进 行 中 值 滤波 
几何 变换 
vision.GeometricRotator 图 像 的 旋转 变换 


vision.GeometricScaler 图 像 的 尺度 变换 





系统 对 象 名 称 


vision.GeometricShearer 


vision.GeometricTransformer 


vision.GeometricTransformEstimator 


vision.GeometricTranslator 


数学 形态 学 操作 


vision.ConnectedComponentLabeler 


vision. MorphologicalBottomHat 


vision. MorphologicalClose 
vision. MorphologicalDilate 
vision. MorphologicalErode 


vision.MorphologicalOpen 


vision.MorphologicalTopHat 


vision.Autocorrelator 
vision.BlobAnalysis 
vision.Crosscorrelator 
vision.Histogram 
vision.LocalMaximaFinder 
vision. Maximum 
vision. Mean 
vision.Median 
vision.Minimum 
vision.PSNR 
vision.StandardDeviation 
vision. Variance 

添加 文字 和 绘图 
vision.AlphaBlender 
vision.MarkerInserter 
vision.ShapelInserter 
vision. TextInserter 

图 像 变换 

vision.DCT 

vision.FFT 
vision.HoughLines 
vision.HoughTransform 
vision.IDCT 
vision.IFFT 
vision.Pyramid 

实用 功能 


vision.ImagePadder 








x 能 
移行 或 列 的 图 像 通 过 线性 变化 的 偏 移 

图 像 的 映射 变换 © 
基于 特征 点 的 几何 变换 矩阵 估计 

图 像 的 几何 平移 


标注 黑白 图 像 中 的 联通 区 域 
对 图 像 进 行 bottom-hat 滤波 


形态 学 闭 运 算 
形态 学 膨胀 运算 
形态 学 腐蚀 运算 
形态 学 开 运算 

对 图 像 进行 Top-hat 滤波 


输入 算 阵 的 2-D 自 相 关 运 算 
联通 区 域 性 质 

两 个 输入 矩阵 的 互相 关 运 算 
输入 图 像 的 直方 图 
查找 局 部 极 大 值 

查找 输入 序列 的 极 大 值 
计算 输入 序列 的 中 值 
寻找 中 间 值 输入 

计算 输入 序列 的 最 小 值 
计算 图 像 的 信 噪 比 

计算 输入 序列 的 标准 莽 
发 现 差 异 值 在 输入 或 输入 序列 


将 两 幅 图 像 进 行 合 加 

在 图 像 内 部 添加 标记 

在 图 像 上 添加 形状 〈 如 圆 形 、 长 方形 ) 
在 图 像 上 添加 文字 


二 维 图 像 离散 余弦 变换 

二 维 图 像 离 散 快 速 傅 里 时 变换 

通过 Hough 变换 查找 图 像 中 的 直线 参数 
对 图 像 进 行 Hough 变换 

进行 二 维 离散 余弦 逆 变 换 
进行 二 维 傅 里 叶 逆 变换 

对 图 像 进行 金子 塔 分 解 


对 图 像 进行 扩充 或 剪彩 
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附录 C Triz FARR 39 项 技术 参数 及 
40 条 创新 原理 
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39 项 技术 参数 


:运动 物体 的 重量 .运动 物体 作用 时 间 制造 精度 

. 前 止 物 体 的 重量 . BRIETIMISTE FESTE TR] . 物体 外 部 有 害 因 系 作用 
运动 物体 的 长 度 . 温度 的 敏感 性 

， 毅 止 物体 的 长 度 .光照 度 .物体 产生 的 有 害 因 素 
.运动 物体 的 面积 .运动 物体 的 .可 制造 性 











能 
， 毅 止 物体 的 面积 . 前 止 物 体 的 能 量 .可 操作 性 
.运动 物体 的 体积 MES 可 维修 性 


. 毅 止 物体 的 体积 . 能量 损 失 她 应 性 及 多 用 性 

.人 速度 .物质 损失 . ELE LARTE 

-J . 信息 损失 .上 监控 与 测试 的 困难 程度 
:应力 或 压力 .时 间 损 失 ， 目 动 化 程度 

.形状 .物质 或 事物 的 数量 A 

.结构 的 稳定 性 . 可 徘 性 

.强度 .测试 精度 





Triz 理论 中 的 40 个 创新 原理 





1. 分 割 原 则 

> 将 人 物体 分 成 独立 的 部 分 。 

> 使 物体 成 为 可 拆 凶 的 。 

> 增加 物体 的 分 割 程度 。 

2. 抽取 原则 

> 从 物体 中 拆 出 “干扰 ”部 分 (“和 干扰” 特性) 或 者 相反 ， 分 出 唯一 需要 的 部 分 或 需要 
的 特性 。 

> 与 上 述 把 物体 分 成 几 个 相同 部 分 的 技法 相反 ， 这 里 是 要 把 物体 分 成 儿 个 不 同 的 
部 分 。 

3. 局 部 质量 原则 

> 从 物体 或 外 部 介质 〈 外 部 作用 ) 的 一 致 结构 过 渡 到 不 一 致 结构 。 

> 物体 的 不 同 部 分 应 当 具 有 不 同 的 功能 。 

> 物体 的 每 一 部 分 均 应 具备 最 适 于 它 工 作 的 条 件 。 

4. 非 对 称 原 则 

> 物体 的 对 称 形式 转 为 不 对 称 形式 。 

> 如 果 物 体 不 是 对 称 的 ， 则 加 强 它 的 不 对 称 程度 。 

5. 合并 原则 

> 把 相同 的 物体 或 完成 类 似 操 作 的 物体 联合 起 来 。 

> 把 时 间 上 相同 或 类 似 的 操作 联合 起 来 。 





























6. 普遍 性 原则 

一 个 物体 执行 多 种 不 同 功能 ， 因 而 不 需要 其 他 物体 。 

7. WEE 

> 一 个 物体 位 于 另 一 物体 之 内 ， 而 后 者 又 位 于 第 三 个 物体 之 内 等 。 > 

> 一 个 物体 通过 另 一 个 物体 的 空 腔 。 

8. Bom Jen 

> 将 物体 与 具有 上 升力 的 另 一 物体 结合 以 抵消 其 重量 。 

> 将 物体 与 介质 〈 最 好 是 气动 力 和 液 动力 ) 相互 作用 以 抵消 甚 重量 。 

9， 预 先 反作用 原则 

如 果 按 课题 条 件 必须 完成 某 种 作用 ， 则 应 提前 完成 反作用 。 

10. 预先 作用 原则 

> 预先 完成 要 求 的 作用 整个 的 或 部 分 的 )。 

> 预先 将 物体 安放 妥当 ， 使 它们 能 在 现场 和 最 方便 地 点 立即 完成 所 需要 的 作用 ， 

1. 预先 应 急 措施 原则 

以 事先 准备 好 的 应 急 手段 补偿 物体 的 底 可 靠 性 。 

12. 等 势 原则 

改变 工作 条 件 ， 使 物体 上 升 或 下 降 。 

13， 道 向 思维 原则 

> 不 实现 课题 条 件 规定 的 作用 而 实现 相反 的 作用 。 

> 使 物 体 或 外 部 介质 的 活动 部 分 成 为 不 动 的 ， 而 使 不 动 的 成 为 可 动 的 。 

> 将 物体 颠倒 . 

14， 曲 面 化 原则 

> 从 直线 部 分 过 渡 到 曲线 部 分 ， 从 平面 过 渡 到 球面 ， 从 正六 面体 或 平行 六 面体 过 渡 到 
球形 结构 。 

> REDE. HR. HEEL 

> 从 直线 运动 过 渡 到 旋转 运动 ， 利 用 离心 力 。 

15， 动 态 化 原则 

> 物体 (或 外 部 介质 ) 的 特性 的 变化 应 当 在 每 一 工作 阶段 都 是 最 佳 的 。 

> 将 物体 分 成 彼此 相对 移动 的 几 个 部 分 。 

> 使 不 动 的 物体 成 为 动 的 。 

16. 不 足 与 超额 行动 原则 

如 果 难 于 取得 百分之百 所 要 求 的 功效 ， 则 应 当 取得 略 小 或 略 大 的 功效 ， 此 时 可 能 把 课题 





























大 大 简化 。 


17. 一 维 变 多 维 原 则 

> 如 果 物 体 作 线 性 运动 (或 分 布 ) 有 困难 ， 则 使 物体 在 二 维度 《〈 即 平面 ) 上 移动 。 相 
应 地 ， 在 一 个 平面 上 的 运动 (或 分 布 ) 可 以 过 渡 到 三 维 空间 。 

> 利用 多 层 结构 百代 单 层 结构 。 
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> 将 物体 倾斜 或 侧 置 。 

> 利用 指定 面 的 反面 。 

> 利用 投 问 相 邻 面 或 反面 的 光 流 。 

18. 机 械 振动 原则 

> 使 物体 振动 。 

> 如 果 已 在 振动 ， 则 提高 它 的 振动 频率 〈 达 到 超声 波 频 率 )。 
> 利用 共振 频率 。 

> HH B. dez EET ND LIRE S] i e 

> 利用 超声 波 振 动 同 电磁 场 配合 。 

19. 周期 性 动作 原则 

> 从 连续 作用 过 渡 到 周期 作用 (脉冲 )。 

> 如 果 作 用 已 经 是 周期 的 ， 则 改变 周期 性 。 

> 利用 脉冲 的 间 握 完成 其 他 作用 。 

20. 有 效 作 用 的 连续 性 原则 

> 连续 工作 (物体 的 所 有 部 分 均 应 一 下 满 负 伍 工作 )。 

> 消除 空转 和 间 知 运转 。 

21. 紧急 行动 原则 

高 速 跃 过 茶 过 程 或 其 个 别 阶段 〈 如 有 害 的 或 危险 的 )。 

22. 变 害 为 利 原则 

> 利用 有 害 因 素 〈 特 别 是 介质 的 有 害 作 用 〉 SNB SR GR e 
> 通过 有 害 因 素 与 男 外 几 个 有 害 因素 的 组 合 来 消除 有 害 因 素 。 
> 将 有 害 因 素 加 强 到 不 再 是 有 害 的 程度 。 

23. 反馈 原则 

> 进行 反问 联系 。 

> 如 果 已 有 反问 联系 ， 则 改变 它 。 

24. 中 介 物 原则 

> 利用 可 以 迁移 或 有 传送 作用 的 中 间 物 体 。 

> 把 另 一 个 〈 易 分 开 的 ) 物体 暂时 附加 给 某 一 物体 。 
25. 自 服务 原则 

> 物体 应 当 为 目 我 服务 ， 完 成 辅助 和 修理 工作 。 

> 利用 废料 (能 的 和 物质 的 )。 

26. 复制 原则 













































































的 、 不 方便 的 或 匈 损坏 


> 用 人 简单 而 便宜 的 复制 品 代 葵 难以 得 到 的 、 复 杂 的 、 郧 吐 


的 物体 。 


> 用 光学 复制 品 《〈《 图 像 ) 代 答 物体 或 物体 系统 。 此 时 要 改变 比例 《放大 或 缩小 复 


制品 )。 





> 如 果 利 用 可 见 光 的 复制 品 ， 则 转 为 红外 线 的 或 紧 外 线 的 复制 。 


27. 一 次 性 用 品 原 则 


用 一 组 廉价 物体 代 奉 一 个 昂贵 物 体 ， 放 痉 菏 些 品 质 〈 如 持久 性 )。 








28. 机 械 系 统 的 替代 原则 
> 用 光学 、 声 学 、 味 学 等 设计 原理 代替 力学 设计 原理 。 
> 用 电场 、 人 磁场 和 电磁 场 同 物体 相互 作用 。 
> 由 恒定 场 转向 不 定 场 ， 由 时 间 固定 的 场 转向 时 间 变 化 的 场 ， 由 无 结构 的 场 转向 有 一 C») 
定 结构 的 场 。 
> AH HOLZ TIR o 
29. 气体 与 液压 结构 原则 
用 气体 结构 和 液体 结构 代 全 物体 的 固体 的 部 分 ， 如 充气 和 充 液 的 结构 、 气 枕 、 毅 液 的 和 
液体 反 冲 的 结构 。 
30. 柔性 外 壳 和 注 腊 原则 
> AH SERES  RXHJ2 MJ. 
» a e te 质 隔 离 。 
. 多孔 材料 原则 
» ee 附加 多 孔 元 件 ( 镶 租 ， 禾 新 等 ) 
> 如 朱 物 体 是 多 扎 的 ， 事 先 用 未 种 物质 填充 空 孔 
32. 改变 颜色 原则 
> 改变 物体 或 外 部 介质 的 颜色 。 
> 改变 物体 或 外 部 介质 的 透明 大。 
> 为 了 观察 难以 看 到 的 物体 或 过 程 ， 利 用 染色 添加 剂 。 
> 如 有 已 采用 了 这 种 添加 剂 ， 则 采用 严 沦 粉 。 
33. 同 质 性 原则 
同 指定 物体 相互 作用 的 物体 应 当 用 同一 《或 性 质 相 近 的 ) 材料 制 成 。 
34. 抛弃 与 再 生 原则 
> 已 完成 目 己 的 使 命 或 已 无 用 的 物体 部 分 应 当 剔 除 〈 深 解 . BRT) 或 在 工作 过 程 中 
直接 变化 。 
> 消除 的 部 分 应 当 在 工作 过 程 中 直接 再 生 。 
35. 物理 /化 学 状态 变化 原则 
这 里 包括 的 不 仅 是 简单 的 过 渡 ， 例 如 从 固态 过 渡 到 液态 ， 还 有 向 “ 假 态 ”( 假 液态 ) 和 
中 间 状 态 的 过 渡 ， 例 如 采用 弹性 固体 。 
36. 相 变 原则 
利用 相 变 时 发 生 的 现象 ， 例 如 体积 改变 ， 放 热 或 吸 热 。 
37. 热膨胀 原则 
> 利用 材料 的 热膨胀 (或 热 收 缩 )。 
> 利用 一 些 热 膀 胀 系数 不 同 的 材料 。 
38. 加 速 氧化 原则 
> 用 量 氧 罕 气 代 鹤 普通 空气 。 
> 用 氧气 符 换 军 氧 空气 。 
> 用 电离 辐射 作用 于 空气 或 氧气 。 
> 用 臭氧 化 了 的 氧气 
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> 用 吴 氧 窒 换 只 氧化 的 (或 电离 的 ) 氧气 。 
39. 惰性 环境 原则 

> 用 惰性 介质 代 叔 普通 介质 。 

> 在 真空 中 进行 茶 过 程 。 

40. 复合 材料 原则 

由 同 种 材料 转 为 混合 材料 。 
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本 书 深入 浅 出 地 介绍 了 数字 图 像 基础 和 MATLAB 数 字 图 像 处 理 的 新 功能 及 其 应 用 案例 ， 同 时 
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